lucene搜索引擎简历

李岩 (lucene搜索引擎)
北京 | 男 | 汉族 | 未婚 | 首都师范大学本科 | 1984年2月生
5年IT从业经验 | 4年软件开发经验 | 4年搜索引擎开发经验(Java,c++)
手机:13366259882
Email: savagert@163.com
MSM:savagert@163.com

工作经历
一.2009年2月---今 北京神州数码思特奇信息技术股份有限公司

主要工作:(lucene搜索引擎)
1. 10086客服知识库中搜索引擎相关产品研发。(山西移动,吉林移动,湖北电信平稳运行1年+)

2. 知识库相关产品部署。
3. 性能压力测试。
主要技术突破:
1.大小索引结构设计与实现。(为了适应增量索引实时性和性能之间的平衡)
2.增量索引:采用trigger+job定时调度方式,设计与实现。
3.分布式索引数据同步rpc方式,设计与实现。(为实现负载均衡,性能与数据完整性之间的矛盾)
4.文件抽取与分词。
5.自动提示js数据结构设计与实现(模仿Google suggest)。(经过多次优化:读数据库->读索引->读本地->采用二维数组提高性能)
6.为提高知识库系统整体性能,减轻数据库压力。采用缓存机制,并支持分布式缓存同步。(ehcach基础上改造重新实现分布式同步)
7.工程部署环境调试。(Linux,AIX,HP,Weblogic81)
8.性能压力测试。(LoadRunner)
9.相关词、相关文章等智能搜索功能

10.分类树数目提示。

12.拼音搜索。(自行设计构造独有拼音词库)

13.同音词搜索。

14.繁体字转简体字搜索。

15.错别字纠错功能。

16.最近搜索。(cookies方式实现)。

17.Faceted search(分面搜索)。包括分类功能和字段过滤功能。

18.lucene源码研究。lucene索引结构研究。lucene相关产品实现

 

项目描述:
从事知识库产品研发。我主要从事知识库中的用lucene实现搜索引擎功能。采用java技术和lucene、poi、pdfBox、paoding、xmlrpc等开源项目整合优化。使知识库中的搜索引擎从无到有。一直到现在具有高性能、全功能、实时更新、分布式同步。并且支持多种数据格式(数据库,office,pdf,html等)完全满足中国移动现有业务的使用。现在知识库已将在山西、吉林,两个省上线运行。搜索引擎更是被做成组建插入到公司多个项目中,在各个项目中实现搜索功能。

1,搜索功能全面,具备如下功能

1)全文搜索,2)自动摘要,3)仅首贴搜索,4)正文搜索,5)标题搜索,6)作者搜索,7)附件搜索,8)二次搜索/重新搜索,9)文章分类树,10)搜索排序,11)高亮显示原文,12)打开原文所在栏目,13)高级搜索,14)google suggest,15)分页导航,16)增量索引,17)分布式同步索引。18)拼音搜索,19)同音词搜索,20)繁体字转简体字搜索,21)错别字纠错功能,22)最近搜索。示例如下图:



2,负责产品环境搭建。和性能压力测试。
   对linux,aix,hp等多种服务器和weblogic部署配置十分熟悉。
   对压力测试工具LoadRunner的使用十分熟悉。
二,2007年11月 — 2009年1月   北京龙卷风科技有限公司(经营企业级中文搜索引擎IRMS)(公司倒闭所有员工被解除合同)
从事基于c++、java的企业级中文搜索引擎开发工作。精通搜索引擎原理。现主要负责公司底层代码编写和修改。同时通过JNI修改和维护jar包。工作还涉及到自然语言处理等高级功能。
1, 工作初期负责公司新产品RU的jsp表现层页面的编写和维护。同时了解公司产品,学习搜索技术。
2, 中期逐渐过渡到底层代码的编写与维护,用到了JNI,JAVA等技术。并简单编译公司软件。
3, 后期负责底层C++(DLL、SO)代码的修改和维护,主要负责索引,搜索,以及相关词,相关文章,自动摘要,热点词等自然语言处理(NLP)相关的跟踪维护。对NLP的基本原理比较熟悉。
三,(培训)2007年5月—2007年10月  加拿大达内科技公司Java软件实习工程师
深入的了解了Java语言及J2EE的架构,同时认真完成了公司布置的项目实战,使自己的技术达到一个更高的阶段,此外还获得信息产业部的<<高级软件工程师证书>>。

项目经验
项目名称:思特奇搜索引擎(lucene搜索引擎)
项目描述:思特奇搜索引擎,作为产品用于知识库中。使知识库具备完美的搜索功能。
所用语言:java

项目名称:企业级搜索引擎RU(具有自然语言处理功能)
项目描述:已具有较成熟的底层DLL连接库,在此基础上运用jsp页面化。涉及到如下功能: 分类树、自动分类、分类规则、黑白名单、分类结果等。
所用语言:java jsp

项目名称:跨库建NLP索引
项目描述:给公司已有的产品添加新功能。实现可以跨多个索引库建NLP索引。
所用语言:C++   Java

项目名称:修改公司产品Bug,实现跨库搜索
项目描述:修改公司产品Bug,实现跨索引库搜索
所用语言:C++  

项目名称:网上图书销售系统
项目描述:该系统运行于Apache Tomcat + Mysql平台。本系统基于MVC模式,主要使用了JSP/Servlet、JavaBean、Struts及Hibernate技术。控制层由Struts提供控制流程,业务逻辑和数据访问由javaBean实现。表现层采用JSP与JSTL及EL相结合,增强了系统的强壮性。分为用户注册模块、管理员模块和购物车模块。实现了对商品的添加、修改、删除、查询;用户模块主要功能有浏览商品、添加商品到购物车、对购物车内商品的增删改操作以及定单的生成。
责任描述:参与该系统购物模块设计。独立开发了三个模块。完成对该系统部分的测试工作,并完善了该项目的相关文档资料。

参与该系统购物模块设计,独立开发了购物车模块,完成对该系统部分的测试工作,并完善了该项目的相关文档资料。
开发环境:
JAVA WEB服务器:Tomcat;
技术选型:Jsp、Servlet、JavaBeans;
数据库:MySQL

职业技能与特长

lucene搜索引擎
 精通Java,非常扎实的Java编程功底,和良好的编码习惯;
了解Unix/Linux环境下java的应用软件开发;
 精通搜索引擎技术和原理。对搜索引擎技术有深刻的理解,熟悉自然语言处理算法
熟悉Lucene,Nutch,Paoding等开源产品
熟练安装、配置、调试Weblogic,Apache Tomcat等服务器并进行JAVA程序的开发部署;
精通基于Web应用的JAVA编程:JavaBean、JSP、Servlet、Struts、Htmlparser、URLRewriter等;
熟练在基于Windows/ Unix的环境下运用Eclipse等集成开发工具进行开发;
熟练掌握基于Oracle/ MySQL的数据库编程:JDBC、SQL、Hibernate、PL/SQL;
熟悉Div&CSS、JavaScript、HTML、XML;
 熟悉搜索引擎优化SEO
熟悉Sun Solaris Unix/RedHat Linux AIX操作系统,特别是Unix/Linux命令行操作;
熟悉计算机专业英语并有较强的查阅英文文档的能力;
了解LoadRunner。压力测试流程。
了解网站推广方法。
了解GlassFish等新兴技术
对程序员身体健康有独特见解,帮助身边的人提高身体素质。
羽毛球,篮球


教育经历
一,2003.9-2007.6  首都师范大学        物理系信息工程       本科学士学位
在校期间除顺利完成学业外,充分发展个人爱好,学习了网站制作和高级网页编程技术。同时在“计算机协会”和“校红十字会“担任部长工作。其间完成多个网站的制作和红十字会的爱心活动。锻炼了自己的组织协调能力和团队合作精神,增强了自己的沟通表达能力。
完成:首都师范大学红十字会网站
   首都师范大学物理实验教学中心网站
   北京市大学生体育协会田径分会网站
二,2004年9月—2005年9月   首都师范大学电脑美术培训
全面学习和运用了各种网站设计和平面设计软件Photoshop,Flash,Dreamwarer.并能熟练使用网页高级编程技术,HTML,VBScript,ASP,JavaScript等。能够熟练进行网站建设、网站维护、网页设计制作、平面设计等。

自我评价:
1诚信第一,做事塌实。
2学习能力强学得快,能吃苦耐劳,有毅力。
3有很强的沟通表达能力和团队合作精神, 能承担巨大的工作压力。
4做事情有规划有计划,勤奋踏实。
5热爱运动,有活力,乐观。
6 热衷学习英语。

 

本人以lucene为工具开发大数据量、高并发、分布式搜索引擎。对整个搜索技术过程非常了解。对高级搜索功能也做过深入研究。日后将继续多lucene搜索引擎做更深入的研究