Skip to content

Commit cd4b5d9

Browse files
Travis build 498 pushed to Github Pages
1 parent 0b3eed9 commit cd4b5d9

30 files changed

+28
-28
lines changed

archives.html

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -92,7 +92,7 @@ <h1 class="content-subhead">Todos as postagens</h1>
9292
<img class="avatar" alt="André Ramos" src="https://www.gravatar.com/avatar/3378af58f0eac9ff22f140bdcbc96685">
9393
</a>
9494
<h5 class="archive-date">2015</h5>
95-
<h4 class="archive-date">20 November</h4>
95+
<h4 class="archive-date">22 November</h4>
9696
<div class="archive-post"><a href="extraindo-texto-de-imagens-com-python.html">Extraindo Texto de Imagens Com Python</a></div>
9797
<p class="archive-meta">André Ramos in <a href="http://pythonclub.com.br/category/manipulacao-de-imagens.html">Manipulação de imagens</a></p>
9898
</div>

archives.html.gz

0 Bytes
Binary file not shown.

author/andre-ramos.html

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -119,7 +119,7 @@ <h3>O que é OCR?</h3>
119119
<a class="pure-button pure-button-primary" href="http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html">Leia mais...</a>
120120
</p>
121121
<p class="post-meta">
122-
in <a href="http://pythonclub.com.br/category/manipulacao-de-imagens.html">Manipulação de imagens</a> &middot; Fri 20 November 2015
122+
in <a href="http://pythonclub.com.br/category/manipulacao-de-imagens.html">Manipulação de imagens</a> &middot; Sun 22 November 2015
123123
</p>
124124
</header>
125125
</section><div class="pagination-wrapper content-subhead">

author/andre-ramos.html.gz

-1 Bytes
Binary file not shown.

category/manipulacao-de-imagens.html

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -119,7 +119,7 @@ <h3>O que é OCR?</h3>
119119
<a class="pure-button pure-button-primary" href="http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html">Leia mais...</a>
120120
</p>
121121
<p class="post-meta">
122-
in <a href="http://pythonclub.com.br/category/manipulacao-de-imagens.html">Manipulação de imagens</a> &middot; Fri 20 November 2015
122+
in <a href="http://pythonclub.com.br/category/manipulacao-de-imagens.html">Manipulação de imagens</a> &middot; Sun 22 November 2015
123123
</p>
124124
</header>
125125
</section><div class="pagination-wrapper content-subhead">
0 Bytes
Binary file not shown.

extraindo-texto-de-imagens-com-python.html

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -74,7 +74,7 @@ <h2 class="article-info">André Ramos</h2>
7474
</ul>
7575
<small class="about-author">Programador web/desktop/mobile. Apaixonado por tecnologia, programação e python.</small>
7676
<h5>Publicado em:</h5>
77-
<p>Fri 20 November 2015</p>
77+
<p>Sun 22 November 2015</p>
7878
<a href="/">&larr;Home</a>
7979
</hgroup>
8080
</header>
0 Bytes
Binary file not shown.

feeds/all.atom.xml

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
<?xml version="1.0" encoding="utf-8"?>
2-
<feed xmlns="http://www.w3.org/2005/Atom"><title>PythonClub</title><link href="http://pythonclub.com.br/" rel="alternate"></link><link href="http://pythonclub.com.br/feeds/all.atom.xml" rel="self"></link><id>http://pythonclub.com.br/</id><updated>2015-11-20T23:00:00-02:00</updated><entry><title>Extraindo Texto de Imagens Com Python</title><link href="http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html" rel="alternate"></link><updated>2015-11-20T23:00:00-02:00</updated><author><name>André Ramos</name></author><id>tag:pythonclub.com.br,2015-11-20:extraindo-texto-de-imagens-com-python.html</id><summary type="html">&lt;h2&gt;Introdução&lt;/h2&gt;
2+
<feed xmlns="http://www.w3.org/2005/Atom"><title>PythonClub</title><link href="http://pythonclub.com.br/" rel="alternate"></link><link href="http://pythonclub.com.br/feeds/all.atom.xml" rel="self"></link><id>http://pythonclub.com.br/</id><updated>2015-11-22T17:00:00-02:00</updated><entry><title>Extraindo Texto de Imagens Com Python</title><link href="http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html" rel="alternate"></link><updated>2015-11-22T17:00:00-02:00</updated><author><name>André Ramos</name></author><id>tag:pythonclub.com.br,2015-11-22:extraindo-texto-de-imagens-com-python.html</id><summary type="html">&lt;h2&gt;Introdução&lt;/h2&gt;
33
&lt;p&gt;Já precisou extrair texto de imagens mas não sabia como? aprenda como fazer isso com apenas 3 linhas de código (Por isso amo python!). Antes de começarmos, vamos ver um pouco de teoria.&lt;/p&gt;
44
&lt;h3&gt;O que é OCR?&lt;/h3&gt;
55
&lt;p&gt;Segundo o Wikipedia, OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador. A engine OCR que vamos utilizar é a &lt;strong&gt;Tesseract&lt;/strong&gt;, a mesma foi inicialmente desenvolvida nos laboratórios da HP e tem seu projeto hospedado em: [https://github.com/tesseract-ocr/tesseract]. Texto adaptado de: [https://pt.wikipedia.org/wiki/Reconhecimento_%C3%B3tico_de_caracteres]&lt;/p&gt;

feeds/all.atom.xml.gz

0 Bytes
Binary file not shown.

feeds/all.rss.xml

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
<?xml version="1.0" encoding="utf-8"?>
2-
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>PythonClub</title><link>http://pythonclub.com.br/</link><description></description><atom:link href="http://pythonclub.com.br/feeds/all.rss.xml" rel="self"></atom:link><lastBuildDate>Fri, 20 Nov 2015 23:00:00 -0200</lastBuildDate><item><title>Extraindo Texto de Imagens Com Python</title><link>http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html</link><description>&lt;h2&gt;Introdução&lt;/h2&gt;
2+
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>PythonClub</title><link>http://pythonclub.com.br/</link><description></description><atom:link href="http://pythonclub.com.br/feeds/all.rss.xml" rel="self"></atom:link><lastBuildDate>Sun, 22 Nov 2015 17:00:00 -0200</lastBuildDate><item><title>Extraindo Texto de Imagens Com Python</title><link>http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html</link><description>&lt;h2&gt;Introdução&lt;/h2&gt;
33
&lt;p&gt;Já precisou extrair texto de imagens mas não sabia como? aprenda como fazer isso com apenas 3 linhas de código (Por isso amo python!). Antes de começarmos, vamos ver um pouco de teoria.&lt;/p&gt;
44
&lt;h3&gt;O que é OCR?&lt;/h3&gt;
55
&lt;p&gt;Segundo o Wikipedia, OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador. A engine OCR que vamos utilizar é a &lt;strong&gt;Tesseract&lt;/strong&gt;, a mesma foi inicialmente desenvolvida nos laboratórios da HP e tem seu projeto hospedado em: [https://github.com/tesseract-ocr/tesseract]. Texto adaptado de: [https://pt.wikipedia.org/wiki/Reconhecimento_%C3%B3tico_de_caracteres]&lt;/p&gt;
@@ -42,7 +42,7 @@ $ sudo -H pip install Pillow
4242
&lt;p&gt;Simples né? Mas nem sempre o texto sai 100% correto, depende muito da qualidade da imagem e da quantidade de detalhes que a mesma possui, porem existe algumas técnicas usadas para fazer melhorias na imagem diminuindo a chance de erros na hora da extração.&lt;/p&gt;
4343
&lt;p&gt;&lt;strong&gt;Alguns links que podem te ajudar a aproveitar ao maximo da tecnologia OCR:&lt;/strong&gt;
4444
&lt;em&gt;[http://pt.scribd.com/doc/88203318/Como-escanear-livros-com-qualidade-e-produzir-textos-por-OCR#scribd]
45-
&lt;/em&gt;[http://profs.if.uff.br/tjpp/blog/entradas/ocr-de-qualidade-no-linux]&lt;/p&gt;</description><dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">André Ramos</dc:creator><pubDate>Fri, 20 Nov 2015 23:00:00 -0200</pubDate><guid>tag:pythonclub.com.br,2015-11-20:extraindo-texto-de-imagens-com-python.html</guid><category>imagens</category><category>ocr</category><category>pytesseract</category><category>extrair texto</category></item><item><title>Django Rest Framework Quickstart</title><link>http://pythonclub.com.br/django-rest-framework-quickstart.html</link><description>&lt;p&gt;Veremos aqui uma forma rápida de criar uma API REST com &lt;a href="http://www.django-rest-framework.org/"&gt;Django Rest Framework&lt;/a&gt;.&lt;/p&gt;
45+
&lt;/em&gt;[http://profs.if.uff.br/tjpp/blog/entradas/ocr-de-qualidade-no-linux]&lt;/p&gt;</description><dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">André Ramos</dc:creator><pubDate>Sun, 22 Nov 2015 17:00:00 -0200</pubDate><guid>tag:pythonclub.com.br,2015-11-22:extraindo-texto-de-imagens-com-python.html</guid><category>imagens</category><category>ocr</category><category>pytesseract</category><category>extrair texto</category></item><item><title>Django Rest Framework Quickstart</title><link>http://pythonclub.com.br/django-rest-framework-quickstart.html</link><description>&lt;p&gt;Veremos aqui uma forma rápida de criar uma API REST com &lt;a href="http://www.django-rest-framework.org/"&gt;Django Rest Framework&lt;/a&gt;.&lt;/p&gt;
4646
&lt;p&gt;Este tutorial é a parte 0/6 de uma série de posts sobre DRF.&lt;/p&gt;
4747
&lt;p&gt;&lt;strong&gt;Obs&lt;/strong&gt;: &lt;em&gt;Tem coisas que é melhor nem traduzir. ;)&lt;/em&gt;&lt;/p&gt;
4848
&lt;ul&gt;

feeds/all.rss.xml.gz

-1 Bytes
Binary file not shown.

feeds/andre-ramos.atom.xml

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
<?xml version="1.0" encoding="utf-8"?>
2-
<feed xmlns="http://www.w3.org/2005/Atom"><title>PythonClub</title><link href="http://pythonclub.com.br/" rel="alternate"></link><link href="http://pythonclub.com.br/feeds/andre-ramos.atom.xml" rel="self"></link><id>http://pythonclub.com.br/</id><updated>2015-11-20T23:00:00-02:00</updated><entry><title>Extraindo Texto de Imagens Com Python</title><link href="http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html" rel="alternate"></link><updated>2015-11-20T23:00:00-02:00</updated><author><name>André Ramos</name></author><id>tag:pythonclub.com.br,2015-11-20:extraindo-texto-de-imagens-com-python.html</id><summary type="html">&lt;h2&gt;Introdução&lt;/h2&gt;
2+
<feed xmlns="http://www.w3.org/2005/Atom"><title>PythonClub</title><link href="http://pythonclub.com.br/" rel="alternate"></link><link href="http://pythonclub.com.br/feeds/andre-ramos.atom.xml" rel="self"></link><id>http://pythonclub.com.br/</id><updated>2015-11-22T17:00:00-02:00</updated><entry><title>Extraindo Texto de Imagens Com Python</title><link href="http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html" rel="alternate"></link><updated>2015-11-22T17:00:00-02:00</updated><author><name>André Ramos</name></author><id>tag:pythonclub.com.br,2015-11-22:extraindo-texto-de-imagens-com-python.html</id><summary type="html">&lt;h2&gt;Introdução&lt;/h2&gt;
33
&lt;p&gt;Já precisou extrair texto de imagens mas não sabia como? aprenda como fazer isso com apenas 3 linhas de código (Por isso amo python!). Antes de começarmos, vamos ver um pouco de teoria.&lt;/p&gt;
44
&lt;h3&gt;O que é OCR?&lt;/h3&gt;
55
&lt;p&gt;Segundo o Wikipedia, OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador. A engine OCR que vamos utilizar é a &lt;strong&gt;Tesseract&lt;/strong&gt;, a mesma foi inicialmente desenvolvida nos laboratórios da HP e tem seu projeto hospedado em: [https://github.com/tesseract-ocr/tesseract]. Texto adaptado de: [https://pt.wikipedia.org/wiki/Reconhecimento_%C3%B3tico_de_caracteres]&lt;/p&gt;

feeds/andre-ramos.atom.xml.gz

0 Bytes
Binary file not shown.

feeds/andre-ramos.rss.xml

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
<?xml version="1.0" encoding="utf-8"?>
2-
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>PythonClub</title><link>http://pythonclub.com.br/</link><description></description><atom:link href="http://pythonclub.com.br/feeds/andre-ramos.rss.xml" rel="self"></atom:link><lastBuildDate>Fri, 20 Nov 2015 23:00:00 -0200</lastBuildDate><item><title>Extraindo Texto de Imagens Com Python</title><link>http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html</link><description>&lt;h2&gt;Introdução&lt;/h2&gt;
2+
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>PythonClub</title><link>http://pythonclub.com.br/</link><description></description><atom:link href="http://pythonclub.com.br/feeds/andre-ramos.rss.xml" rel="self"></atom:link><lastBuildDate>Sun, 22 Nov 2015 17:00:00 -0200</lastBuildDate><item><title>Extraindo Texto de Imagens Com Python</title><link>http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html</link><description>&lt;h2&gt;Introdução&lt;/h2&gt;
33
&lt;p&gt;Já precisou extrair texto de imagens mas não sabia como? aprenda como fazer isso com apenas 3 linhas de código (Por isso amo python!). Antes de começarmos, vamos ver um pouco de teoria.&lt;/p&gt;
44
&lt;h3&gt;O que é OCR?&lt;/h3&gt;
55
&lt;p&gt;Segundo o Wikipedia, OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador. A engine OCR que vamos utilizar é a &lt;strong&gt;Tesseract&lt;/strong&gt;, a mesma foi inicialmente desenvolvida nos laboratórios da HP e tem seu projeto hospedado em: [https://github.com/tesseract-ocr/tesseract]. Texto adaptado de: [https://pt.wikipedia.org/wiki/Reconhecimento_%C3%B3tico_de_caracteres]&lt;/p&gt;
@@ -42,4 +42,4 @@ $ sudo -H pip install Pillow
4242
&lt;p&gt;Simples né? Mas nem sempre o texto sai 100% correto, depende muito da qualidade da imagem e da quantidade de detalhes que a mesma possui, porem existe algumas técnicas usadas para fazer melhorias na imagem diminuindo a chance de erros na hora da extração.&lt;/p&gt;
4343
&lt;p&gt;&lt;strong&gt;Alguns links que podem te ajudar a aproveitar ao maximo da tecnologia OCR:&lt;/strong&gt;
4444
&lt;em&gt;[http://pt.scribd.com/doc/88203318/Como-escanear-livros-com-qualidade-e-produzir-textos-por-OCR#scribd]
45-
&lt;/em&gt;[http://profs.if.uff.br/tjpp/blog/entradas/ocr-de-qualidade-no-linux]&lt;/p&gt;</description><dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">André Ramos</dc:creator><pubDate>Fri, 20 Nov 2015 23:00:00 -0200</pubDate><guid>tag:pythonclub.com.br,2015-11-20:extraindo-texto-de-imagens-com-python.html</guid><category>imagens</category><category>ocr</category><category>pytesseract</category><category>extrair texto</category></item></channel></rss>
45+
&lt;/em&gt;[http://profs.if.uff.br/tjpp/blog/entradas/ocr-de-qualidade-no-linux]&lt;/p&gt;</description><dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">André Ramos</dc:creator><pubDate>Sun, 22 Nov 2015 17:00:00 -0200</pubDate><guid>tag:pythonclub.com.br,2015-11-22:extraindo-texto-de-imagens-com-python.html</guid><category>imagens</category><category>ocr</category><category>pytesseract</category><category>extrair texto</category></item></channel></rss>

feeds/andre-ramos.rss.xml.gz

3 Bytes
Binary file not shown.

feeds/manipulacao-de-imagens.atom.xml

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,5 @@
11
<?xml version="1.0" encoding="utf-8"?>
2-
<feed xmlns="http://www.w3.org/2005/Atom"><title>PythonClub</title><link href="http://pythonclub.com.br/" rel="alternate"></link><link href="http://pythonclub.com.br/feeds/manipulacao-de-imagens.atom.xml" rel="self"></link><id>http://pythonclub.com.br/</id><updated>2015-11-20T23:00:00-02:00</updated><entry><title>Extraindo Texto de Imagens Com Python</title><link href="http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html" rel="alternate"></link><updated>2015-11-20T23:00:00-02:00</updated><author><name>André Ramos</name></author><id>tag:pythonclub.com.br,2015-11-20:extraindo-texto-de-imagens-com-python.html</id><summary type="html">&lt;h2&gt;Introdução&lt;/h2&gt;
2+
<feed xmlns="http://www.w3.org/2005/Atom"><title>PythonClub</title><link href="http://pythonclub.com.br/" rel="alternate"></link><link href="http://pythonclub.com.br/feeds/manipulacao-de-imagens.atom.xml" rel="self"></link><id>http://pythonclub.com.br/</id><updated>2015-11-22T17:00:00-02:00</updated><entry><title>Extraindo Texto de Imagens Com Python</title><link href="http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html" rel="alternate"></link><updated>2015-11-22T17:00:00-02:00</updated><author><name>André Ramos</name></author><id>tag:pythonclub.com.br,2015-11-22:extraindo-texto-de-imagens-com-python.html</id><summary type="html">&lt;h2&gt;Introdução&lt;/h2&gt;
33
&lt;p&gt;Já precisou extrair texto de imagens mas não sabia como? aprenda como fazer isso com apenas 3 linhas de código (Por isso amo python!). Antes de começarmos, vamos ver um pouco de teoria.&lt;/p&gt;
44
&lt;h3&gt;O que é OCR?&lt;/h3&gt;
55
&lt;p&gt;Segundo o Wikipedia, OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através do OCR é possível obter um arquivo de texto editável por um computador. A engine OCR que vamos utilizar é a &lt;strong&gt;Tesseract&lt;/strong&gt;, a mesma foi inicialmente desenvolvida nos laboratórios da HP e tem seu projeto hospedado em: [https://github.com/tesseract-ocr/tesseract]. Texto adaptado de: [https://pt.wikipedia.org/wiki/Reconhecimento_%C3%B3tico_de_caracteres]&lt;/p&gt;
1 Byte
Binary file not shown.

index.html

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -120,7 +120,7 @@ <h3>O que é OCR?</h3>
120120
<a class="pure-button pure-button-primary" href="http://pythonclub.com.br/extraindo-texto-de-imagens-com-python.html">Leia mais...</a>
121121
</p>
122122
<p class="post-meta">
123-
in <a href="http://pythonclub.com.br/category/manipulacao-de-imagens.html">Manipulação de imagens</a> &middot; Fri 20 November 2015
123+
in <a href="http://pythonclub.com.br/category/manipulacao-de-imagens.html">Manipulação de imagens</a> &middot; Sun 22 November 2015
124124
</p>
125125
</header>
126126
</section><section class="post">

index.html.gz

2 Bytes
Binary file not shown.

0 commit comments

Comments
 (0)