热门搜索: 小程序 管理系统 APP QQ:619795130
文章来源:设计52   发布者:毕业设计   浏览量:1783  
手机搜索引擎

研究的预期目标:

基于B/S模式,通过Internet网能够较好的展现北京易查无限信息有限公司手机搜索引擎(即yicha.cn)的产品平台,实现网站产品(网页、小说、MP3、美图、软件)的相关资料与需求查询、搜索链接等以此能够满足手机用户上网的需求。

主要特点及创新点:

本毕业设计的成果包括完整的软件系统和相关的软件文档,软件系统是本设计的最主要成果,设计的内容还包括外文资料翻译等相关文档。各项都符合毕业设计要求,即软件系统能够正常运行,响应速度快、处理能力强、省时、省力、质量高,软件文档实现规范化。

从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。

互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。网络信息搜索程序可以通过已知的站点地址通过网员的连接进而获得信息。Internet网上的信息组织按照网页中信息的链接,可看作一个有向图。网络中的信息搜索过程可以看作一个图搜索过程,本系统首先要设计一个好的图搜索算法,能够高效获取网络中的信息。

   在获得网上的信息后,要根据网页中的信息提取该信息的分类信息或关键词,同时,将信息的适当格式传给搜索引擎的信息服务程序,以便用户的查询。

本文以参照模拟北京易查无限信息技术有限公司的手机搜索引擎为例,来实现企业的产品展示平台,该公司作为中国无线互联网第一个手机搜索引擎,中国最大的手机搜索引擎,易查已获得国际VC3000万美金投资。易查具有丰富的产品线,提供包括网页搜索、娱乐搜索、生活搜索等在内的众多搜索服务。易查搜索从2006年开始陆续与新浪、腾讯等多家门户建立合作关系。不仅为新浪网、腾讯网、凤凰网等数万家大中小互联网网站提供移动搜索服务,还为联想、TCL、中国电信小灵通等手机,以及UCWEB、QQ手机浏览器等提供搜索服务。

搜索引擎系统功能模块图,也就是搜索引擎的原理图。根据毕业设计要求,我要完成的功能是两大的模块的功能:信息发现模块和信息加工模块。其中,信息发现模块就是信息搜索模块,信息加工模块就是信息处理程序,并由此模块完成向数据库存储信息的功能。

管理员通过管理监视界面管理和监视”蜘蛛” 在互联网上的运行情况,并根据实时情况做出一些处理。管理监视界面控制的信息搜索模块,而信息搜索模块一面把搜索到的网页网址信息返回到管理监视界面,一面把搜索到的网页内容送到信息处理模块。信息处理模块接到网页内容后,调用数据字典中的分类信息与之匹配,整理提取网页信息,然后把整理好的信息存到数据库中。这样 ” 蜘蛛 ” 就不知疲倦的在互联网上爬行,提取信息存入数据库以备客户端用户的查询。

对各个搜索引擎来说可以采取不同的分类算法,这取决于系统的要求。

在本项目中采取的分类算法,不求多么复杂,但力求准确,而且要保证系统的效率。所以,该系统采取了依据数据字典的分类算法,把分类的繁重工作分出一部分交给系统管理员。这样既能保证系统效率,又能保证分类的准确性和实时性。因为网上资源是不断更新的,而且有些只能是实时需求的。

根据系统要求制定分类策略

网页的分类是一项繁重的任务,它含有人工智能的成分,而在本系统为求得分类的准确和快速,采用了依据数据字典中的分类信息进行分类的策略。数据字典的格式在前面已有介绍。它主要是借助于人工对相当数量的关键字进行分类,程序通过匹配关键字来达到分类的目的。下面是本项目采取的分类策略。

首先,关键字和网页标题进行匹配,如果匹配成功,那么把该网页信息存放到与之匹配成功的关键字所在类目下。

如果关键字和网页标题匹配不成功,那么把关键字和网页内容进行匹配,计算出关键字出现的次数,如果出现次数达到预定次数,同样把网页信息存放到该关键字所在类目下。本方案中设定次数为2 就可以把网页信息存放到数据库中。



资源信息

格式: rar
  • 上一篇:基于asp.net玩具企业信息化平台建设
  • 下一篇:小区门户网站的设计与实现