李岩的自我介绍
李岩 (lucene搜索引擎)
北京 | 男 | 汉族 | 未婚 | 首都师范大学本科 | 1984年2月生
3年IT从业经验 | 3年软件开发经验 | 2年搜索引擎开发经验(Java,c++)
手机:13366259882
Email:
MSM:savagert@163.com
工作经历
一.2009年2月---今 北京神州数码思特奇信息技术股份有限公司
主要工作:(lucene搜索引擎)
1. 10086客服知识库中搜索引擎相关产品研发。(山西移动,吉林移动,湖北电信平稳运行1年+)
2. 知识库相关产品部署。
3. 性能压力测试。
主要技术突破:
1.大小索引结构设计与实现。(为了适应增量索引实时性和性能之间的平衡)
2.增量索引:采用trigger+job定时调度方式,设计与实现。
3.分布式索引数据同步rpc方式,设计与实现。(为实现负载均衡,性能与数据完整性之间的矛盾)
4.文件抽取与分词。
5.自动提示js数据结构设计与实现(模仿Google suggest)。(经过多次优化:读数据库->读索引->读本地->采用二维数组提高性能)
6.为提高知识库系统整体性能,减轻数据库压力。采用缓存机制,并支持分布式缓存同步。(ehcach基础上改造重新实现分布式同步)
7.工程部署环境调试。(Linux,AIX,HP,Weblogic81)
8.性能压力测试。(LoadRunner)
9.相关词、相关文章等智能搜索功能
10.分类树数目提示。
12.拼音搜索。(自行设计构造独有拼音词库)
13.同音词搜索。
14.繁体字转简体字搜索。
15.错别字纠错功能。
16.最近搜索。(cookies方式实现)。
17.Faceted search(分面搜索)。包括分类功能和字段过滤功能。
18.lucene源码研究。lucene索引结构研究。lucene相关产品实现
项目描述:
从事知识库产品研发。我主要从事知识库中的用lucene实现搜索引擎功能。采用java技术和lucene、poi、pdfBox、paoding、xmlrpc等开源项目整合优化。使知识库中的搜索引擎从无到有。一直到现在具有高性能、全功能、实时更新、分布式同步。并且支持多种数据格式(数据库,office,pdf,html等)完全满足中国移动现有业务的使用。现在知识库已将在山西、吉林,两个省上线运行。搜索引擎更是被做成组建插入到公司多个项目中,在各个项目中实现搜索功能。
1,搜索功能全面,具备如下功能
1)全文搜索,2)自动摘要,3)仅首贴搜索,4)正文搜索,5)标题搜索,6)作者搜索,7)附件搜索,8)二次搜索/重新搜索,9)文章分类树,10)搜索排序,11)高亮显示原文,12)打开原文所在栏目,13)高级搜索,14)google suggest,15)分页导航,16)增量索引,17)分布式同步索引。18)拼音搜索,19)同音词搜索,20)繁体字转简体字搜索,21)错别字纠错功能,22)最近搜索。示例如下图:
2,负责产品环境搭建。和性能压力测试。
对linux,aix,hp等多种服务器和weblogic部署配置十分熟悉。
对压力测试工具LoadRunner的使用十分熟悉。
l 熟悉Sun Solaris Unix/RedHat Linux操作系统,特别是Unix/Linux命令行操作;
l 熟悉计算机专业英语并有较强的查阅英文文档的能力;
l 了解软件开发流程、CVS、ANT工具、UML、OOA/D、单元测试技术(JUnit);
l 了解基于EJB的应用开发、Spring框架;
l 了解GlassFish等新兴技术
工作经历:
从事基于c++、java的企业级搜索引擎开发工作。精通搜索引擎原理。现主要负责公司底层代码(c++)编写和修改。同时通过JNI修改和维护jar包。负责的功能主要有NLP,相关文章等。