2016年7月26日上午,一封上线通知发送到了中国移动通信集团的所有部门,这标志着由中国移动苏州研发中心自主研发的OA搜索系统正式在集团范围内上线试用。
OA系统是移动内部最常用的办公信息系统,系统使用者们对于公文的搜索功能要求很高,且由于集团OA系统数据量庞大,公文种类繁多,对于底层数据的抽取整合、重新建立索引的工作量也非常大。苏州研发中心大数据部搜索引擎组的小伙伴们,通过近半年的辛苦奋斗,终于克服种种困难,将OA搜索系统成功上线啦!
在本次项目过程中,最大的困难来源于数据源种类多,数据量大,且由于底层数据库建设时间久远,所以缺乏文档和技术类支撑。在比较艰难的情况下,大数据部搜索引擎组的小伙伴们共完成配置文件1万余行,配置文种30大类,254小类,数据抽取共计30余万条,建立清洗规则80余条,最后成功“啃”掉了底层数据这个大难题,玩儿转了底层老旧的数据库。有了数据,那么剩下的问题就是用我们苏小研的搜索引擎产品BC-SE构建搜索系统啦!
说到构建搜索引擎系统,这绝对是苏小研的BC-SE产品的强项:分布式的搜索引擎系统架构、丰富的搜索接口、优化的中文语义理解模块、高效的搜索流程设计等等,这些都是BC-SE的必杀技!同时,区别于市场上其他的企业级搜索引擎,BC-SE提供了优质的搜索运营服务功能,提供搜索热词查询、高级搜索后台配置、结果置顶/屏蔽、多租户管理等搜索运营服务,将搜索能力以平台化、能力化提供,可以为其他信息系统提供方便、快捷、一站式的搜索服务。
这次苏小研为集团提供的OA搜索系统,采用了先进的分布式搜索引擎架构,同时在系统中加入了具有移动特色的中文词库优化搜索分词效果(词库是由BC-SE的“新词发现”功能通过自然学习算法提炼出来的哦!),提供了基于相似度、时间、组合筛选条件等丰富的搜索接口,且搜索响应时间基本稳定在100ms以内,从搜索效果和搜索速度上均满足了日常用户对于OA公文搜索的需求。
在本次OA搜索项目开发上线过程中,苏研北京技术支持中心也给予了大力的支持和配合,北支的小伙伴们和大数据部的小伙伴们一直紧密合作,全力解决线上线下的各种问题。同时,也要感谢政企公司的小伙伴,从中协调资源,推进项目进度。大家一起奋斗的感觉,真的很好!
未来苏小研的搜索引擎团队,将会更加致力于搜索效果和搜索系统架构的优化工作,为各类信息系统提供稳定、高效的搜索服务,做最好最稳定的企业级搜索引擎!