Tỷ lệ lỗi chính tả trung bình của văn bản tiếng
Việt là 7,79%, cao gần 8 lần so với chuẩn 1%. Đáng nói, tỷ lệ lỗi khu
vực Đại học và Viện nghiên cứu cũng xấp xỉ mức trung bình xã hội.
Báo cáo Tình hình chính tả văn bản
tiếng Việt do Viện Công nghệ Thông tin - ĐH Quốc gia Hà Nội và Công ty
VieGrid công bố hôm qua (28/7) cho thấy, tỷ lệ lỗi chính tả trong văn
bản tiếng Việt đã ở mức báo động, vượt quá cao so với tiêu chuẩn.
Cụ thể, trong tháng 6 vừa qua, nhóm nghiên cứu đã thống kê trên
67.000 mẫu của 177 đơn vị trong 7 khu vực, lựa chọn phương pháp thống kê
với tập lỗi điển hình. Tập lỗi dùng để đánh giá trong đợt này được chọn
từ một số lỗi phổ biến như:
bổ xung, sử lý, xử dụng, sáng lạn, cọ sát, soi mói, thăm quan… Kết quả, các từ có tỷ lệ lỗi cao nhất là “soi mói” với 74,33%, “sáng
lạn” 41,66%, “cọ sát” 28,38%, “thăm quan” 20,61%... Đơn vị có nhiều lỗi
nhất là Cục Vệ sinh an toàn thực phẩm 38,46%, tiếp đến là Viện Năng
lượng nguyên tử 31,49%. Đơn vị có ít lỗi nhất thuộc về ngành ngân hàng.
Khu vực báo chí và truyền thông có tỷ lệ lỗi chính tả cao nhất, gần
mức báo động 10%. Trong đó, cả hai khu vực này đều có các đại diện có tỷ
lệ lỗi gần hoặc vượt mức 30%. Khu vực chính quyền địa phương, và các cơ
quan thuộc Bộ cũng có tỷ lệ lỗi chính tả khá cao. Đặc biệt, có đơn vị
có tỷ lệ lỗi gần 40% như Cục Vệ sinh an toàn thực phẩm. Tỷ lệ lỗi khu
vực Đại học và Viện nghiên cứu cũng xấp xỉ mức trung bình của xã hội.
Trong khi đó, nhóm khá nhất là doanh nghiệp và các Bộ có tỷ lệ lỗi 7,47- 19,98% vẫn bỏ xa mức chuẩn 1%.
Sai lỗi chính tả hiện diện ở mọi nơi (Ảnh có tính minh họa) TS Nguyễn Ái Việt, Phó Viện trưởng Viện Công nghệ thông tin, ĐH
Quốc gia Hà Nội cho biết, trước khi đánh giá chất lượng chính tả văn bản
tiếng Việt, nhóm nghiên cứu đã tiến hành một cuộc điều tra tại 2 nhóm
Chuyên gia ngôn ngữ và Chuyên gia CNTT: Nhóm chuyên gia ngôn ngữ yêu cầu
tỷ lệ lỗi chính tả trong văn bản Việt phải là dưới 1%. Nhóm chuyên gia
CNTT chấp nhận tỷ lệ này trong khoảng 2,5-5%.
Các chuyên gia đều thống nhất cho rằng, tỷ lệ 10% là ngưỡng báo động
đối với các lỗi chính tả và 30% là ngưỡng mà một lỗi chính tả đã trở
thành một cách viết có thể đồng thời được chấp nhận. Theo đề nghị này,
từ “soi mói” đã trở thành từ đúng với tỷ lệ sử dụng hơn 74%, “sáng lạn”
có thể xem như một cách viết tương đương với “xán lạn” do đạt tỷ lệ sử
dụng gần 42%. Các lỗi “cọ sát”, “thăm quan” đều đến mức báo động đỏ.
“Kết quả trên phản ánh tình trạng báo động của chính tả tiếng Việt.
Nhóm nghiên cứu sẽ tiến hành tiếp các đợt đánh giá tiếp theo với quy mô
rộng hơn, nhằm mở đường cho một chiến dịch cộng đồng về quét lỗi chính
tả”- TS Việt nói.
Theo GS, TS ngôn ngữ học Trần Trí Dõi, trong vòng 20 năm qua các Bộ,
Ngành đã liên tiếp ban hành những quy định khác nhau về văn bản tiếng
Việt. Ví dụ, 1/7/1983, Hội đồng “Chuẩn hóa chính tả” và “Hội đồng chuẩn
hóa thuật ngữ” đã ký chung một Quyết định có nội dung về “Những quy định
về chính tả tiếng Việt”. Đến 5/3/1984 lại có thêm Quyết định 240/QĐ của
Bộ Giáo dục Quy định về chính tả tiếng Việt và thuật ngữ tiếng Việt.
Đến năm 2002, Bộ này lại có “Quy định tạm thời về chính tả trong sách
giáo khoa mới” và 2003 có thêm “Quy định tạm thời về viết hoa tên riêng
trong sách giáo khoa”…Đến 6/2006 Bộ Nội vụ cũng đưa ra một “Dự thảo” về
“Quy định về viết hoa và phiên chuyển tiếng nước ngoài trong văn bản”
tiếng Việt nhằm dùng trong địa hạt hành chính...
GS Dõi cho rằng, không thể để mãi tình trạng thiếu thống nhất của các
Bộ, Ngành trong quy chuẩn văn bản tiếng Việt như vậy. Đã đến lúc phải
xây dựng Luật Ngôn ngữ có tính thống nhất và khoa học dùng để áp dụng
chung trên toàn quốc.