Nơi giúp các bạn giao lưu, trao đổi, học hỏi nhiều kinh nghiệm rất mong các bạn đóng góp và góp ý giúp cho VTComputer phát triển hơn
   
 
  Scan To Word
VnDOCR v4.0 Professional

 
Bạn cần tổng hợp thông tin từ nhiều loại giấy tờ, sách báo ư ? Thật là đơn giản nếu như bạn đã có một bộ Máy tính, Scanner (máy quét) thì hãy mua Phần mềm Nhận dạng chữ Việt in VnDOCR 4.0, tức là bạn đã tiết kiệm được rất nhiều công sức cũng như tiền bạc. Môi trường + PC với hệ điều hành Windows 9x, Windows ME, Windows 2000, Windows XP hoặc Windows NT, Tiện ích : Bộ gõ chữ Việt và bộ phông ABC, VNI, Unicode.. Thông tin đưa vào + Quét trực tiếp các loại sách báo, văn bản qua máy quét (scanner). + Đọc và xử lý hơn 30 dạng tệp tin ảnh phổ dụng nhất như PCX, BMP, TIF, GIF, JPG, ... Có thể nhận dạng trực tiếp tài liệu quét qua scanner, không cần lưu trữ dưới dạng tệp ảnh trung gian. Các trang tài liệu có thể được quét và lưu trữ dưới dạng tệp tin nhiều trang. Có thể là các dạng tệp tin của Microsoft Word (.doc), tệp ký tự ASCII (.txt), Rich Text Format (.rtf), *.xls (đối với bảng biểu). Độ chính xác 99 % ! VnDOCR cũng nhận dạng các tài liệu đã qua Photocopy. http://www.vndocr.com
Download: http://www.phamduyminh.com/Software/OCR%20Tools/VnDOCR%20v4.0%20Professional.rar Pass: www.phamduyminh.com https://www.orbitfiles.com/download/id293692403.html
VnDOCR Professional 3.0 http://www.vndocr.com/upload/vndocrdemo30.zip


Sử dụng hiệu quả VnDOCR 4.0 Demo
Nếu bạn đã sử dụng VnDOCR 4.0 bản demo để biến văn bản tiếng Việt in trên giấy thành file vi tính mà chưa được hài lòng cho lắm thì hãy thử xem qua kinh nghiệm dưới đây. Đối với các trang gồm chữ đen trên nền giấy trắng thì kết quả rất khả quan, có thể đạt được đến 97, 98%. Riêng những trang có background là màu thì tùy theo màu nền mà VnDOCR có thể nhận dạng được (rất thấp) hoặc không nhận dạng được. Sau đây là các bước thực hiện để đạt được hiệu quả cao trong khi sử dụng VnDOCR 4.0: 1. Bạn có thể scan trực tiếp từ máy scan chứ không nhất thiết phải chọn scan từ trong chương trình VnDOCR. Khi scan trực tiếp, bạn chọn Scan to File. Trong ô Image Type, bạn chọn Text/Line Art (chỉ có ở dạng Text/Line Art thì VnDOCR mới nhận dạng được) chứ đừng chọn Color Document hay Black & White Document. Trong ô Destination, bạn chọn Epson Stylus Printer (Fine). Trong ô Resolution, bạn chọn độ phân giải là 400 dpi. Bạn có thể chọn độ phân giải là 300 dpi hoặc thấp hơn tùy ý, tuy nhiên, VnDOCR khuyến cáo là chỉ nhận dạng tốt nhất ở độ phân giải 400 dpi mà thôi. 2. Sau khi scan xong, trong ô Type Format, bạn phải chọn save theo dạng file TIFF- uncompressed (+.TIF) thì VnDOCR mới có thể nhận dạng được. Đây là điều quan trọng, vì nếu bạn lỡ quên mà save theo dạng +.JPG hoặc +.BMP thì sau này, dù bạn có chuyển đổi sang dạng TIF, VnDOCR cũng không nhận dạng được. 3. Bây giờ bạn khởi động VnDOCR, trong cửa sổ VnDOCR 4.0, nhấp nút Chấp nhận. Vào menu Tệp > Đọc ảnh, mở file vừa scan. Bên cửa sổ phía trái sẽ hiện ra nội dung của file được mở ra. Nếu lúc nầy, bạn vào menu Xử lý > Nhận dạng thì VnDOCR sẽ mặc nhiên chọn chế độ phân vùng tự động và có thể nó sẽ phân vùng sai và định dạng sai một số vùng. Do đó bạn nên vào menu Xử lý > Đánh dấu vùng bằng tay / Tạo mới. Lúc nầy, con trỏ sẽ đổi dạng thành dấu cộng lớn. Bạn đưa dấu cộng vào điểm khởi đầu của vùng muốn nhận dạng, nhấp và giữ phím chuột trái rồi kéo rê đến điểm cuối của vùng muốn chọn, xong thả ra. VnDOCR sẽ đánh dấu vùng được chọn bằng một khung hình chữ nhật. Nếu vùng được chọn không đúng theo ý mình, bạn có thể xoá nó đi bằng cách đưa con trỏ chuột vào khung chữ nhật rồi nhấp phím phải chuột. Một menu con hiện ra, bạn nhấp chọn mục Xóa, khung chữ nhật sẽ biến mất. Bây giờ bạn có thể làm lại thao tác vừa rồi để chọn vùng khác. Bạn có thể chọn nhiều vùng và mỗi vùng bạn chọn, VnDOCR sẽ đánh dấu bằng một con số. Nếu văn bản có nhiều cột và hình, bạn có thể chọn tiếp các vùng khác và không chọn hình ảnh. Sau khi chọn xong, bạn vào menu Xử lý > Nhận dạng. VnDOCR sẽ lần lượt nhận dạng các khung chữ nhật mà bạn đã đánh dấu thành vùng 1, 2, 3... Sau khi nhận dạng xong, VnDOCR sẽ đưa các vùng được nhận dạng sang cửa sổ phía bên tay mặt. Trong mỗi khung chữ nhật là văn bản mà VnDOCR đã nhận dạng xong, những ký tự hoặc các từ hay đoạn văn mà VnDOCR nghi ngờ là không đúng sẽ được thể hiện bằng màu đỏ. Tuy nhiên, các từ màu đen cũng vẫn có thể bị sai, cho nên bạn hãy tô đen tất cả để tránh bị rối mắt. 4. Vì bản VnDOCR của chúng ta đang sử dụng là bản demo (không mất tiền mua) cho nên VnDOCR không cho chúng ta lưu lại thành file Word. Nhưng bạn đừng lo, chúng ta sẽ đánh dấu từng vùng đã được nhận dạng trong khung chữ nhật (bôi đen) rồi copy vào clipboard, đem paste vào một file mới trong Word rồi save lại. 5. VnDOCR nhận dạng và thể hiện văn bản với font .VnTime (font ABC - TCVN3). Nếu máy bạn không có font này hoặc có nhưng muốn chuyển sang font thuộc bảng mã khác thì có thể dùng các chương trình chuyển mã để thực hiện như bình thường. Sau khi chuyển mã xong, bạn chọn toàn bộ văn bản (Ctrl-A), vào menu Format > Font, chọn font color là Automatic (màu đen), chọn font size sao cho dễ đọc và biên tập lại được dễ dàng (cỡ 12 hay 14). Bạn chú ý, khi quét ảnh văn bản phải chọn chế độ quét ra là ảnh đen trắng (16 bit) thì VnDOCR mới nhận dạng được. Trong quá trình scan cho phép mình điều chỉnh chế độ màu, size và độ phân giải.. bạn chỉ cần chú ý chuyển qua chế độ màu đen trắng là được.
Sử dụng VnDOCR 4.0 thông qua "mẹo" Aqua Deskperience

 

VnDOCR là chương trình nhận dạng ký tự tiếng Việt. Phiên bản 3.0 Demo đã được sử dụng lâu nay. Thời gian trước đây, VnDOCR 4.0 cũng đã chính thức ra mắt. Trong phiên bản 4.0 này, chương trình hỗ trợ hoàn toàn bảng mã Unicode (bản 2.0 chỉ có VNI - Time và TCVN3) và theo nhà sản xuất, chất lượng nhận dạng của phiên bản 4.0 thông minh và hiệu quả hơn người anh của nó. Thế nhưng, bản 4.0 mà nhà sản xuất phát hành cho người dùng miễn phí cũng là bản demo và hạn chế rất nhiều chức năng như: chỉ cho nhận dạng tối đa 3 file ảnh, không cho copy và sao lưu (save). Vỏ quýt dày có móng tay nhọn, ông bà ta chẳng từng nói thế là gì. "Móng tay" để "lột quýt" VnDOCR 4.0 chính là Aqua Deskperience. Aqua Deskperience là chương trình chụp ảnh màn hình, công việc chính của nó là ghi lại những gì đang hiện diện trên màn hình, bất kể đó là hình ảnh hay văn bản, nó đều có khả năng sao chụp. Ta lợi dụng công cụ này làm phương tiện trung gian để nhờ nó copy văn bản trong VnDOCR 4.0 rồi dán qua MS Word. Các công đoạn thực hiện như sau: 1. Bạn tải VnDOCR 4.0 và Aqua Deskperience về cài đặt 2. Mở file văn bản cần nhận dạng: Phải là file tif, quét trắng đen, độ phân giải 300dpi 3. Dùng chương trình VnDOCR 4.0 nhận dạng file xong, cửa sổ bên phải là kết quả nhận dạng 4. Mở chương trình Aqua Deskperience, nhấn phí tắt Ctrl + Shift rồi chọn vùng là văn bản đã được VnDOCR 4.0 nhận dạng. Chương trình xác nhận bạn có đồng ý copy văn bản trong vùng chọn không? Bạn click vào 1 mẫu văn bản để xác nhận copy. 5. Sau cùng, mở cửa sổ MS Word để dán (paste hoặc Ctrl + V) văn bản vừa copy. Lưu ý: VnDOCR 4.0 chỉ cho bạn nhận dạng tối đa 1 lúc 3 file ảnh. Vì vậy sau khi thực hiện xong 3 file, bạn đóng rồi mở lại chương trình để nhận dạng 3 file tiếp theo. Aqua Deskperience: http://www.deskperience.com/Setup/AquaSetup.exe
Download Full
http://www.box.net/shared/q4ozlxxbn7
 
Yahoo Messenger VTComputer
 
Yahoo! Messenger
 
Tổng Số Người Đã Truy Cập
 
Thông Tin Hằng Ngày
 
- VTComputer đang trong quá trình hoàng thành các bạn vui lòng góp ý về DuongVan.Tinh@gmail.com rất mong nhận được sự góp ý của các bạn...
 
This website was created for free with Own-Free-Website.com. Would you also like to have your own website?
Sign up for free