1.分词规则算法。
2.索引和搜索,数据分布式存储和计算。
3.网页内容去重规则和算法。
4.相关搜索词算法。
5.搜索词汇纠错算法。
6.多语言处理。
7.服务器规划,不同系统对服务器的配置要求和数量。
8.用户搜索行为分析。根据用户输入的关键词分析用户意图。给出更准确的结果
9.排序规则。参与排序的因素和权重因子。
10.整个系统高可用、高并发实现。
11.死链检测的方法
12.迅速下线的方法
13.如何评估搜索效果
14.屏蔽词机制
15.搜索结果去重的机制方法
16.结果页中的特殊展示结果是如何运作的,包括展现样式是合作方提供还是自己设计开发
17.是否有先进的技术可以帮助央视搜索处理无任何文字标签的视频数据