受编码、字库等技术局限,现有中文输入法存在很多无法输入的“缺字”,近年来已经为不少人造成了困扰,成为值得关注的现象。为此,主流中文输入法厂商搜狗倾力发起了“一字千金”特别活动,旨在众筹网友智慧征集“缺字”,以填补目前网络输入法的输入盲点。近日,搜狗综合“一字千金”战果发布了《中文输入缺字报告》,据统计,活动42天期间参与人次达20.48万,征集到有效“缺字”超过4万2千个。评论认为,这一报告除了填补了当前中文输入法在汉字库方面的一大空白,具有领先业界的技术意义外,更重要的则在于:在搜狗的倡导下,不少几近被遗忘的汉字被重新挖掘,再次走入人们的视线中。汉字是中华文明数千年流传的精华所在,而搜狗的缺字征集行动,将有助于汉字文化在“E时代”得到飞升。
字即知识,搜狗打造最“博学”输入法
故国源远三千年,先贤造字,蕴含的是知识的斑驳。据统计数据显示,今天人们所流传下来的汉字,约有10万之多。但不容乐观的是:这“十万大军”之中,常为所用的“精兵”却不过7000左右,即使仅这7000”精兵”中间依然存在不少“缺字”。比如(王莹),(韦华)作为常用人名就尝尝被输入法拒绝。因此中文输入法急需“埋头补课”,进一步提高“识字”能力。而作为输入法领域当之无愧的老大,搜狗显然已经率先意识到了缺字问题的重要性。通过“一字千金”活动,搜狗输入法在它的第九个年头,终于向着汉字这片广袤的海洋发起了新的探索。
从内容看来,搜狗所发布的《中文输入缺字报告》,不仅覆盖率高(实际寻回缺字超过4万个),更借助网民的参与,初步形成了有关缺字的分类和词频数据。例如报告中列出的缺字七宗“最”,提交频率均超过了1万人次。业内人士指出,缺字输入的编码问题已经基本得到解决的背景下,缺字报告意味着搜狗已经充分做好了建立更“博学”、更强大的汉字字库的准备,有望成为首款支持超过5万个汉字的中文输入法。由此带来的输入体验上的独占级优势,将级大地巩固搜狗输入法在同类产品中的压倒性优势。
字即传承,搜狗助濒危汉字互联网“重生”
以键代笔,终至“提笔忘字”,几乎已成了互联网时代汉字文化退化的一个缩影。“音形分离”的特点,使得包括汉字在技术和通信高度发达的今天,面临着与基于字母的语言完全不同的挑战:日常书写与计算机输入形式上的差别,令非常用字词的存续越发困难。文字的传承与输入法的进步,似乎不可避免地走向了“既分高下,也决生死”的境地。
不过,搜狗输入法首次激起全民对“缺字”问题的关注,使得输入技术的发展开始向着与传统文化传承之间达成“和解”、甚至相互促进的方向转变。借助《中文输入缺字报告》以及后续可能推出的进一步改进,搜狗输入法正在令那些濒临消亡的汉字在互联网中“复生”过来,并将自己打造成亿万用户与悠久汉字文化间的核心接口。网络时代,“即使生命已经逝去,过去的痕迹和记忆仍然将在数据中永远存活下去”。从这个层面上讲,搜狗输入法的努力,正创造着汉字文明“E时代”的新传承。