中国盲文数字平台诞生记

期次:第934期    作者:本报记者 任 妍 校报记者团 王曦晨 张路遥 联合采访 罗小芳 马 强   查看:300


苏伟  兰州大学 信息无障碍研究中心主任


  2019年3月22日,在我校举行的2019人工智能西部高峰论坛上,中国盲文数字平台正式启动,这是我国首例面向中国1700万视障人群、集生活学习工作于一体的综合性公共服务平台。
  中国盲文数字平台到底有哪些功能?它是怎样服务于视障人群的?在它的研发背后有着怎样的故事?平台的未来发展面临着哪些瓶颈?带着诸多疑问,近日,本报记者(以下简称“记”)专访了中国盲文数字平台的主要研发者、我校信息无障碍研究中心主任苏伟(以下简称“苏”)。

    

  记:中国盲文数字平台的主要功能是什么?
  苏:主要功能有两大块,一个是翻译功能,能够将汉语、英语、数理化公式、音乐乐谱等翻译成盲文,另一个是资源服务管理功能,能够实现海量文档资料的存储及访问,供盲人阅读。
  记:有关这两大功能,具体如何操作,请您谈一下。
  苏:就翻译功能而言,操作是非常简单的,以将汉语英语翻译成盲文为例,在翻译框里输入或拷入一段文字,一点击“预览盲文”,我们就能看到翻译成的盲文,再一点击“打印预览”,就能将翻译出来的盲文打印出来。对于音乐乐谱、数理化公式,也都是基本一样的操作。
  就资源管理功能来说,操作有点类似百度文库,用户可以上传、下载、管理各种文档,也可以对文档资源进行打分、评论,并可以与好友分享文档。
  记:只有盲人可以使用平台吗?
  苏:中国盲文数字平台有一个非常重要的特点和优点,就是所有文档书籍不会涉及版权问题。因为根据《马拉喀什条约》和我国著作权法,以盲人能够感知的独特方式向其提供已经发表的文字作品,不需要征得原作者和原出版社的同意,在中国盲文数字平台上,用户可以把最新的、更多的资源放到平台上,所以理论上来讲,平台上资源的增长速度会比其他公共平台的要更快。
  平台采用开放式架构,所有人都可注册使用并上传资源。视障者输入残疾人证号后,如果浏览到涉及版权的内容,系统会自动以盲文和语音的形式呈现;而明眼人在浏览到涉及版权的内容的时候需付费或通过其他方式取得版权后方可访问。

  

  记:汉语翻译成盲文与英语翻译成盲文相比,哪个更复杂?
  苏:汉语。盲块总共有64个,英语翻译成盲文的时候,一级英语盲文中26个字母每个都可以对应到一个盲块上,汉语则做不到,汉语翻译成盲文要经过机器分词、多音字标注、音盲转换、缩写和标点符号校正等步骤,每个步骤都是一个科研难题,所以说如果汉语翻译成盲文的难度是100分,那么英语翻译成盲文的难度可能只有10分。
  记:盲人如何将想要翻译的文字或乐谱或数理化公式输入到翻译框里?又怎么输出出来呢?
  苏:我们明眼人使用鼠标及虚拟光标定位来实现电脑操作,盲人操作电脑和手机时需借助读屏软件,读屏软件会将屏幕及键盘输入内容通过语音报给他。对于翻译成盲文的内容,盲人可通过两种方式访问,一是点显器,点显器相当于盲人的显示器,点位具有凹凸感,盲人可摸读;另外也可通过盲文刻印机将内容刻印在专用纸张上,然后再摸读。您看这本书,就是盲文版的数学书,内容和咱们九年义务教育通用教材是一模一样的,专门给盲人学生用的。
  记:在咱们国家,是否有专门的出版社出版盲文教材?
  苏:有,就是中国盲文出版社,但目前的实际情况是中国盲文出版社人手有限,所以他们只能保障所有盲文课本的出版,而对于教辅书及其他文档资料是存在出版空白的,我国每六万个盲人一年平均占有一种出版物,而每位明眼人平均每年就占有10种出版物;中国残联和中国盲人协会为解决这一难题,委托我们开发了中国盲文数字平台,这是为了解决全国视障者盲文资源短缺问题。
  

  记:平台翻译的准确率怎么样?

  苏:根据我们的测试,准确率大概在90%到95%之间,对于要正式出版的还要经过人工“三校”。即便如此,也节省了大量前期的工作。以前像数理化公式、音乐乐谱等,都是纯人工翻译的,如果要翻译一首乐谱,翻译人员不仅要懂盲文,还要懂盲文乐谱、五线谱、简谱,这在全国都没有几个人能翻译,所以以前中国盲文出版社真正出版的盲文乐谱非常少,大概一年也就翻译几十首,现在一年翻译好几百首都没有问题。
  记:平台的使用是否与盲校的教学已实现对接?
  苏:这也是我们正在做的事。因为盲校师资招聘相对困难,所以很多盲校招聘老师的时候并不要求老师一定懂盲文。老师不懂盲文,那么对老师而言最快捷有效的办法就是说出来,学生用专门的盲文写字板和厚纸记笔记,在纸上扎出来,然后摸读,我们叫“正扎反摸”。如果是老师讲课、学生记笔记,这当然没问题;但如果是老师布置作业、学生把作业“扎”出来,这个就要花费较长的时间。现在,兰州盲聋哑学校的老师们借助中国盲文数字平台,把作业自动翻译成盲文,然后刻印出来,老师的工作量降低了,学生也节约了大量扎写作业时间。

  

  记:您前面说到的读屏软件可以访问一切网络资源吗?
  苏:读屏软件能把屏幕上的内容转换成语音,视障人士只需点击键盘按键,滑动手指或双击屏幕就能获取相关的信息。现在读屏软件的功能已经比较成熟,但有些问题是读屏软件无法解决的。网站和软件代码书写不规范会导致读屏软件读不出信息或读出错误信息,影响盲人的判断,会导致信息障碍问题。
  近两年,我们与中国残联、中国盲文协会一起,正在开展信息无障碍相关工作。信息无障碍就是让任何人,无论是健全人还是残疾人,无论是年轻人还是老年人,在任何情况下都能平等地、方便地、无障碍地获取信息、利用信息。当前我们国家的很多网站、软件、手机APP在开发时并没有考虑盲人访问的问题,不符合信息无障碍的标准,读屏软件就无法读出内容,对盲人而言就是有障碍。
  在这方面,现在我们着力开展两项工作,一是从2018年开始,我们和中国残联、中国盲人协会联合策划,一起倡议在全国高校里推广信息无障碍的课程;第二是我们正在研究人工智能算法,实现全国网站信息无障碍的自动检测系统,利用机器学习算法对网站进行自动修订,以促进网站信息的无障碍。
  记:咱们国家是否有对网站和软件的开发要符合信息无障碍标准的规定?
  苏:我们国家在这方面做了很多努力,制定了一系列的政策和标准,2016年中国残联、国家网信办出台《关于加强网络无障碍服务能力建设的指导意见》,2017年国务院又印发了《“十三五”推进基本公共服务均等化规划》。在标准方面,有2012年制定的《网站设计无障碍技术要求》和《网站设计无障碍评级测试方法》。但这些标准不是强制标准,现在很多网站并没有做到位。当然,这里面有一些做的比较好的公司,例如腾讯公司和阿里巴巴公司,他们都有专门的部门负责信息无障碍开发与测(下转三版)