ACERCA DE · CONTACTO · RSS · ·

despuesdegoogle

internet y pos(t)modernidad


Atención: Este blog ya no se actualiza. Desde el 22 de agosto de 2011 se ha integrado en el nuevo blog tiempos pos(t)modernos, que te invitamos a visitar



Archive for the ‘ocr’ tag

Google Docs amplía soporte OCR a 34 idiomas, incluido el catalán

one comment

Google DocsEl reconocimiento de caracteres en archivos de imagen o PDFs ya era psoible en Google Docs desde el pasado verano, aunque estaba limitado a cinco idiomas, entre ellos el español.
Ahora Google aumenta el soporte de OCR (Optical Character Recognition, Reconocimiento Óptico de Caracteres) a un total de 34 idiomas entre los que se encuentra el catalán.
OCR es un estándar que permite extraer y editar texto que forma parte de imágenes o PDFs, y se usa especialmente en el caso de archivos escaneados.

Para activar OCR en Google Docs cuando subimos un archivo basta marcar la opción
Convertir el texto de archivos PDF o de archivos de imagen a documentos de Google Docs
Docs OCR

Una vez que abramos el documento, Google Docs nos muestra este aviso:
Docs OCR_

Y ya podemos editar el texto que Google Docs haya podido extraer, que no siempre es el 100%.

Written by emiligene

marzo 4th, 2011 at 12:26 pm

Posted in estandaresFormatos

Tagged with , ,

Google Docs convierte una imagen con texto en texto editable: OCR online

leave a comment

A la mejor manera de OCR pero online y sin escáner de por medio: guardas como imagen de alta resolución un poster, catálogo, fax o página que contenga texto, lo subes a Google Docs y este lo convierte en un archivo de texto editable.
Se trata de una función todavía experimental (demo), que permite igualmente traducir el documento mientras se sube.
Como diría Jesulín: “En dos palabras: im – presionante”.
Sobre todo cuando funcione bien

La noticia, en el blog DATA APIs de Google
Y de regalo: Google Docs, ahora con soporte para ecuaciones y formulas químicas (exponentes o subíndices)

Written by emiligene

septiembre 29th, 2009 at 4:37 pm

Posted in en la nube

Tagged with ,

Convierte PDF escaneado a texto editable con Google OCR

leave a comment

Si no tienes software OCR y quieres convertir tus archivos PDF provenientes de una operación de escaneo (no valen los producidos con software de edición, tanto da que sea el oficial de Adobe como OpenOffice haciendo las veces de conversor), basta que sigas estos pasos:
1. Súbelos a una carpeta en tu sitio
2. Crea una página que enlace a todos los PDFs que contiene esta carpeta
3. Espera (unos días) a que el robot de Google la indexe
4. Accede mediante esta dirección:
site:tu_sitio/carpeta_pdf filetype:pdf

Ya puedes abrir como HTML un archivo PDF:

Truco compartido por Digital Inspiration

Written by emiligene

octubre 31st, 2008 at 7:08 pm

Posted in conversion,en la nube

Tagged with ,