拼写检查中,一般会有两种类型错误:非词错误和真词错误。非词错误就是词语写错 了,词典中没有这个词语。例如英语中的单词拼写错误。真词错误就是词语或单词拼 写没有错,但是关联上下文语境,就会发现该词使用错误。这就是涉及语法相关知识 来判断,才能识别。所以拼写检查一般就是检查非词错误。

那么,在蒙古文拼写检查中的错误类型又表现如何呢?

实际上,严格来说也是如此——蒙古文无非就是非词错误和真词错误。但是有些人会 将一种非词错误认为是真词错误——蒙古文中很多母在特定条件下会有相同的写法, 这就导致有些词单纯从视觉表现看没错。也就是基于词形查看,有些词形看起来是正 确词,但是,可能却是一个错误拼写。蒙古文是拼音文字,蒙古文 Unicode 也是一种 基于读音进行编码的文字系统。所以,在输入的时候,首先,要根据读音输入。如果 偏离了读音,而是根据词形进行输入,那基本就会输入错误了。这些视觉上正确,但 是读音不对的词——其输入字符序列完全异于正确读音——这些词对于计算机而言就是 输入错误的词——非词错误,有些人将这些词也认为是真词错误,这本是就是混淆了词 形输入和读音输入的根本区别。所以,对于基于读音的蒙古文输入法,所谓的词形正确, 读音不对的词就是非词错误。

导致非词错误的原因有哪些呢?我认为可分为这几类:

  1. 不懂蒙古语文,或者不懂基于读音的蒙古文输入法,按照词形输入导致错的没有章 法的,可以算做“乱”型;
  2. 懂蒙古语文及输入法,但是有些时候不按规则来,只要能保证输入基本字形即可的 “懒”型;
  3. 认真输入,但还是会忙中出错,这种错误基本有迹可寻,属于百密一疏的“漏”型;

对于第一种情况,往往发生于蒙古语文的初学者,这可以通过逐步学习避免再犯错误。 但是这种错误又是不可避免的——因为永远有初学者。这很好,初学者多说明这种语言 文字还很有活力!

对于第二种情况,是可以通过校对软件调整的,但最好还是在输入时就尽量正确输入。

对于第三种情况,也是可以通过校对软件发现和纠正错误的,而且这种错误才是真正 的、难以避免的错误,也是校对软件存在的意义。

所以,校对软件都是基于语法规则和词典校对小错误,帮助避免可以避免的错误。如 果是大的错误,那就不是校对了,完全是修改,是那种可能修改结果完全预料不到的 那种修改——这也不是校对软件的任务了。