Question 1

Que calidad puedo esperar de la extraccion de texto OCR?

Accepted Answer

La precision del OCR depende de la calidad del documento escaneado. Escaneos limpios y de alta resolucion con fuentes estandar generalmente alcanzan una precision del 90-99%. Escaneos borrosos, escritura a mano o fuentes inusuales produciran menor precision.

Question 2

Que idiomas son compatibles?

Accepted Answer

Soportamos 9 idiomas: espanol, ingles, portugues, frances, aleman, italiano, holandes, japones y coreano. Selecciona el idioma correcto antes de procesar para mejorar significativamente la precision del reconocimiento.

Question 3

Cual es la diferencia entre PDFs escaneados y PDFs de texto?

Accepted Answer

Un PDF de texto contiene caracteres reales que se pueden seleccionar y copiar directamente. Un PDF escaneado contiene imagenes de paginas sin texto seleccionable. El OCR es necesario para PDFs escaneados para extraer el texto de las imagenes.

Question 4

Mi PDF se envia a un servidor para el procesamiento OCR?

Accepted Answer

No. Tu PDF permanece en tu dispositivo. El motor OCR Tesseract.js y el modelo de idioma (~15 MB) se descargan a tu navegador una vez y se almacenan en cache. Todo el reconocimiento de texto ocurre localmente en tu navegador.

OCR PDF — Extraer texto

Como usar esta herramienta

Acerca de esta herramienta

Preguntas frecuentes