吕振羽很感兴趣地问:“哦,有些什么办法?”
“现在,语音平台作为核心,这个不用去动了,该怎么卖还是怎么卖,但是插件就不同了。我们可以卖插件啊。比如那个用语音操作电脑的插件,稍微再完善一下,制作一个比较有特色的界面,完全可以作为一个强大的桌面程序,乃至于作为一个系统外壳程序来用。不是有人喜欢把pc的操作界面弄得像mac吗?我们也可以做到,而且是一个全语音界面。本来我们没有界面设计师,不过苏大哥说,这几天就给我们落实这个人,据说有希望签下一个绝代高手。如果是这样,这个产品应该是很有希望的,当然,定价方面还要斟酌,因为面对个人用户,贵不起来。还有,就是那个会议软件,也可以进行很大的扩展。索尼不就是有一套视频会议系统,软件结合硬件,一套能卖上好几十万,支持16个人同时参加会议的吧。在功能上,我们的会议插件功能并不差,就是包装比较有问题,硬件其实也就是一些电视和音响设备,如果要开,相信国内外,应该有不少厂商愿意和我们合作。这类产品的销售数字不会很高,但每一套的利润都非常可观。……还有一个产品,同样是结合硬件的,就是用于公安系统的讯问记录系统,硬件方面比较简单,因为我们的中文语音输入方面对方言的宽容度相当大,而且随着方言插件的不断产生,以后的宽容度会更好,这套设备如果能够和公安方面达成协议,应该是一笔很大的单子。”
这个主意倒是出乎大家的意料。软件领域人人都知道,赢得政府采购的订单是什么意思,虽然单个软件的价格可能比较低,但经不住数量大啊。假如这个审讯记录系统能赢得政府方面的订单,那对公司是非常有利的。
“老雷阿,你怎么想到这个的?”陈宁不由得插嘴道。陈宁心里想,只要这个产品能做出来,凭着她手里的关系,签下这个单子应该没什么问题。
“这个是彭彭的一个朋友提出的,那个朋友是市局……”雷涛也不是很清楚事情的来龙去脉,看了看彭汉年。
彭汉年说:“那个朋友是市局一个处长。在以前的公司工作的时候,有一次公安局数据库软件招标的时候认识的。他前天打电话给我,跟我说他们局里最近终于打印版的报告数量比手写的多了,报告的电子存档制度也终于可以顺利进行,就是因为不少警员都开始使用我们的语音平台写报告。他就问我,能不能给他们做个内部文档录入和文档数字化的解决方案。他给了我一份需求建议,主要是描述公安系统内的几种文档,报告之类的东西都好办,就是审讯记录,现在还是靠记记录,事后整理的。我就动了这个脑筋。”
“公安系统的内部文档数字化平台?”大家面面相觑。这个东西只要开出来了,几乎不怕卖不掉,而且一旦达成采购意向,软件硬件加起来就不是小数字。只要上海地区一旦开始采用并且获得良好效果,这套东西就会立刻在全国铺开。
“这样吧,柳源侠,这个项目就交给你负责吧。实验室里你挑4个程序员一起,然后再想办法招两个懂音频和硬件的,一起。那个数字化视频会议系统也一起交给你们了。”吕振羽稍微想了想之后说。然后,吕振羽又看了看陈宁,说:“陈宁,等一下我和你谈谈这个项目好吗?”
陈宁有点错愕,这种和政府相关的项目,自己帮忙是应该的啊?为什么要找自己谈。
吕振羽没有多说什么,他只是开始说自己的一些想法:“谢谢大家提醒。确实,语音平台这个产品做出来之后,我闷着头写插件,忽略了很多东西。后来想想,哪怕这个软件能卖1亿份,那又能如何?大家设想的这些高附加值的产品,确实是我们需要的。接下来,我想开的是另外一个东西——翻译软件。”
第一卷 神说,要有光 23.抢所有翻译的饭碗
吕振羽深深吸了一口气,脑子里回响着在家里的电脑上模拟各种翻译的成果。掌握了大量知识的小羽才能真正挥语义和语用为平台的语音和新的全部功能。其实,翻译软件,严格地说只是语音平台的一个相当高级的插件而已,只不过,这个插件的功能之强大,会掩盖住语音平台的光芒。
语音平台是一个内外两层的大型程序,外部是语音的输入和输出,但真正关键的则是以智能核心为基础的语义和语用判断机制。而这个机制,同样是一个两层的结构,一层是语义和语用的甄别,另一层则是按照具体语用和语境,进行组织,从而生成具有相当强的可读性的句子,而作为这一层功能的底子,仍然是非常主流的结构语法学。结构语法学是有缺陷的,比如,在中文里,很多具体例子都无法用结构语法学去套用。比如“春风又绿江南岸”的这个绿字,语文老师们都会说这个绿字用得好,有色彩也有动态,但是从语法学上来说呢?绿是形容词,怎么就能做谓语呢?如果翻译成英语,大概会是make江南岸green的词组来表示,但中文里怎么解释?现代汉语的语法是从欧洲对结构语法学的方法里脱胎而出的,而古文似乎从来不讲究什么语法。于是,老师们或许会说,中文就可以这么用,而到了后来,有一种解释很有趣,老师不说是主语谓语宾语,而是说占据主语位置占据谓语位置占据宾语位置。……这个解释算是通顺了,但对于程序员来说,如果没有一个出色的判断机制,是没有办法好好处理中文的翻译问题的,而其他语种之间,尤其是拉丁语系的语种之间,这个问题简单得多。结构语法学的惯例是主流,而例外相当少,至少,在日常使用的方面,例外相当少。文学……尤其是诗歌,那就没办法了。
吕振羽的翻译软件的机制很简单,同样调用语义和语用的判断机制,将输入的语音或者文本变成一个意义串,然后套用另一个语种的结构语法和词库,以这样的方法来完成翻译。这种翻译,已经能比较良好地进行整句全文翻译,而最恐怖的功能,则是这个软件能进行同声口译。设想一下,高级口译证书是一个怎么样恐怖的东西,而那还只是中文与英文之间的口译,而吕振羽开的这个基于语义和语用判断的翻译软件,只要需要,几乎可以进行任何语种之间的同声口译。
在开这个软件的最初产品的时候,吕振羽将所有适用结构语法学的编程全部交给了小羽,而自己专心研究特例的处理,这项工程开始了没几天,已经取得了相当让人惊异的成果。小羽已经完成了数十种语言的结构语法学编程,对于小羽来说,这些工作只用了不到一个工作日。而吕振羽还在拼命研读各个语种的教材和字典,目前,英语的特例补充包基本完成了,法语完成了一部分,而中文……由于特例实在太多,只好一边分析一边建立这个库了。
吕振羽仍然是不紧不慢地将自己已经取得的成果说给大家听,当然,隐去了小羽在其中的极为重要的作用。看到大家看着他的目光渐渐变得狂热和崇拜,吕振羽的脸在烧。
“你的这个软件什么时候能完成?”路德坤热切地问。他知道,这个软件只要一问世,肯定会掀起一阵狂潮,困扰中国人,尤其是中国学生多年的外语问题一下子就会变得不重要了。世界上的任何一个人,与素昧平生的任何一个外国人交流,也将变得轻松简单。当然,这都要这个软件足够完美,完美到不因为语种差异而产生误解。
“工作量太大了,所以我今天提出来,准备交给实验室继续完成阿。”吕振羽苦笑道,这种重复性的工作,小羽也已经出手帮忙了,但一方面,语言方面的数据处理量极大,而另一方面,吕振羽作为一个个人,能获得的语言资料也有限,根据他在市场上东奔西跑买来的各种资料构建的这个平台,肯定存在不少问题。
“这个项目交给我吧。”路德坤自告奋勇道。路德坤确实是最适合这个项目的,他基础扎实,有丰富的大型程序开经验和团队团里经验。“应该聘请相当一些各国的语言学家来一起进行完善,光靠国内那帮外语教授什么的估计有问题。”路德坤认真地说。
“嗯,我也是这么想的,接下来的事情就交给你了。开包和一些简单的文档我也写好了。”吕振羽窃喜,这个烫手山芋有人接下来再好不过,后期几乎都是重复性工作,太折磨人了。
楼家明突然问道:“全文翻译能达到一个什么水平?”
吕振羽嘿嘿笑了笑,从包里拿出几页打印纸,递给楼家明,说:“这是我用全文翻译功能翻译的安徒生童话里的《海的女儿》,完全没有作手动调整,只是后面套用了一下语音平台的雅致文本输出插件处理了一把。不过是按照英文译本再翻译过来的。”
楼家明接过打印稿,大致看了一下。整个故事翻译得语句通顺优美,用词华丽雅致,虽然有些细节上还稍稍有些生硬,但哪怕这个版本放到出版市场上,应该也称得上是一个不错的版本。楼家明的脸色从凝重变得轻松,转而又有了一丝苦笑,他说:“大学里学了那么多年英语,难道就白学了?你这个东西做出来,要抢光翻译的饭碗了啊。”
“没有白学,这个软件做到现在,英语我称得上精通了,法语德语意大利语俄语捷克语和希伯来语我也学了个遍……不会白学的。无论程序展到一个怎么样的高度,人与人之间的交流还是最重要的。无论软件怎么达,我们还是需要草婴,王道乾这样的翻译家。”吕振羽说。他说的是真心话。
几张纸的打印稿在大家手里传了一遍。大家沉默了一会。吕振羽太擅长创造奇迹了。语音平台是个好软件,甚至是个里程碑式的软件,而这个翻译软件,或许能造成更大的风潮吧。