Optik Karakter Tanıma (OCR) nedir?

Optik Karakter Tanıma (OCR), bilgisayarların elle yazması veya metni girmesi gerekmeden okuyabileceği basılı, yazılı veya el yazısıyla yazılmış bir belgenin dijital bir sürümünü oluşturan yazılım anlamına gelir. OCR genellikle taranan belgeler üzerinde PDF formatında kullanılır, ancak bir görüntü dosyası içinde bir metnin bilgisayar tarafından okunabilir bir sürümünü de oluşturabilir.

OCR nedir?

Metin tanıma olarak da adlandırılan OCR, basılı veya yazılı belgelerden sayılar, harfler ve noktalama işaretleri (glifler olarak da adlandırılır) gibi karakterleri bilgisayar ve diğer yazılım programları tarafından daha kolay tanınan ve okunan bir elektronik forma dönüştüren yazılım teknolojisidir. Bazı OCR programları bunu bir belge tarandıktan veya bir dijital fotoğraf makinesiyle fotoğraflandıkça yapar ve diğerleri bu işlemi daha önce OCR olmadan taranan veya fotoğraflanmış olan belgelere uygulayabilir. OCR, kullanıcıların PDF belgeleri içinde arama yapmasına, metni düzenlemesine ve belgeleri yeniden biçimlendirmesine olanak tanır.

OCR Ne için Kullanılır?

Hızlı, her gün tarama ihtiyaçları için OCR büyük bir sorun olmayabilir. Çok miktarda tarama yaparsanız, ihtiyacınız olanı tam olarak bulmak için PDF'lerde arama yapabilmek oldukça uzun zaman kazandırabilir ve tarayıcı programınızda OCR işlevselliğini daha da önemli hale getirebilir. İşte OCR aşağıdaki konularda yardımcı olur:

Neden OCR Kullanmalı?

Neden sadece fotoğraf çekmiyorsunuz, değil mi? Çünkü herhangi bir şeyi düzenleyemezsiniz ya da metni aramazsınız çünkü bu sadece bir görüntü olur. Belgeyi taramak ve OCR yazılımını çalıştırmak, bu dosyayı düzenleyebileceğiniz ve arama yapabileceğiniz bir şeye dönüştürebilir.

OCR tarihi

Metin tanımanın en erken kullanımı 1914'e kadar sürerken, OCR ile ilgili teknolojilerin geniş kapsamlı gelişimi ve kullanımı, özellikle dijital olarak okunabilir metne dönüştürülmek için daha kolay olan çok basitleştirilmiş fontların oluşturulmasıyla 1950'lerde ciddi bir şekilde başlamıştır. Bu basitleştirilmiş yazı tiplerinden ilki, David Shepard tarafından oluşturuldu ve yaygın olarak OCR-7B olarak biliniyordu. OCR-7B, bugün kredi kartlarında ve banka kartlarında kullanılan standart yazı tipi için finans sektöründe halen kullanılmaktadır. 1960'larda, çeşitli ülkelerdeki posta hizmetleri, Amerika Birleşik Devletleri, Büyük Britanya, Kanada ve Almanya dahil olmak üzere posta sıralamasını büyük ölçüde hızlandırmak için OCR teknolojisini kullanmaya başladı. OCR hala posta hizmetleri için postaları dünya çapında sıralamak için kullanılan temel teknolojidir. 2000 yılında, OCR teknolojisinin limitleri ve yetenekleri hakkında önemli bilgiler, botları ve spam yapanları durdurmak için kullanılan CAPTCHA programlarını geliştirmek için kullanıldı.

Yıllar boyunca, OCR yapay zeka , makine öğrenimi ve bilgisayar görüşü gibi ilgili teknoloji alanlarındaki gelişmeler nedeniyle daha doğru ve daha sofistike bir hale geldi. Bugün OCR yazılımı, belgeleri daha önce hiç olmadığı kadar hızlı ve doğru bir şekilde dönüştürmek için kalıp tanıma, özellik algılama ve metin madenciliği kullanmaktadır.