Hình như cái vụ chuyển từ ảnh sang text này dễ mà, trên máy in HP đã có chức năng scan 1 văn bản ra file word rồi. Mình cho phần mềm tự scan rồi chỉnh lại chính tả (nếu có) là xong thôi mà
Quan trọng là cái chỉnh lại chính tả đấy... Đâu phải dễ dàng gì chuyển ảnh sang text đâu, phải cần source rất là sạch sẽ, vì hầu hết ảnh giờ đều có logo, chữ chìm, bla bla bla, v.v... phải hiệu chỉnh lại. Hai là scan xong phải chỉnh lại chính tả (khó là cái này này)... Nói dễ như bạn chắc ai cũng khỏe hết rồi còn gì đả tự nữa...
Theo mình cái khó là source phải sạch thôi, chứ mình cũng từng scan rất nhiều văn bản tiếng Anh trong công việc và cho kết quả rất chính xác và ít lỗi. Phần tiếng Việt thì có hơi khó 1 chút nhưng cũng đã có 4-5 năm trước rồi
Tiếng anh thì OCR nhận diện dễ rồi, tiếng việt nhận cao lắm 80-85% thôi, còn lại hầu như phải có biên edit lại hết...