IT学习者 | 文章大全 | 技术文档 | 桌面壁纸 | 实用查询 | 网络电台 | 成语 | 歇后语 | 网址 | 下载 | 周公解梦 | 生日密码 | 电视剧365 | Flash
 您现在的位置: IT学习者 >> 文章大全 >> 学习认证 >> 搜索技巧 >> [专题]搜索引擎9238

每日搜索评论2--什么是用搜索引擎搜不到的[增补版]

【 作者:搜索引擎9238    来源:搜索研究院  更新时间:2003-8-21 | 字体:

每日搜索评论2--什么是用搜索引擎搜不到的[增补版]

搜索引擎9238 2002.1

  没有搜索引擎是万万不能的,但搜索引擎不是万能的;

  有些内容,网上明明存在,但是你用搜索引擎搜不到。如果事先理解搜索引擎能做的和不能做的,你就可以设计更佳的搜索策略。而搜索之前思考一下搜索策略,是搜索成功最关键的一步。


这样的内容,主要有3类:
======================

1、网上有,但是搜索引擎库里没有
------------------------------------------------------

1.1 spider未能正确处理的网页性质及文件类型
(如flash、script、ps、某些动态网页及frame、数据库)
1.2 没有指向链接的孤岛网页
1.3 spider访问时因为某些原因正好是死链接
1.4 被认为是劣质网页而不抓
1.5 因为/色情/反动/spam/等问题而不抓的非法网页
1.6 需要输入用户名、密码方可打开的网页
1.7 网站用robots协议拒绝搜索引擎抓取的网页
1.8 搜索引擎还未来得及抓取的新网页
1.9 gopher、newsgroups、Telnet、ftp、wais等非http信息
1.10 网站数据库做得太差劲,spider一抓就宕,只好不抓


2、搜索引擎库里有,但是未能正确索引网页中信息
------------------------------------------------------

2.1 分词引起误差
2.2 图型中的文字信息你看得懂但搜索引擎看不懂
2.3 停用词等搜索引擎故意不索引的信息
2.4 搜索引擎对某些网页有选择的索引,未索引全部网页信息


3、搜索引擎正确索引了网页中信息,但和你用的关键词不同
-------------------------------------------------------

3.1 你用的搜索关键词中含有错别字
3.2 网页作者用了错别字
3.3 没有错别字,但网页作者用的词汇和你的关键词不同,毕竟,文字的特性,允许有n种方式表达同一种信息
3.4 简体繁体不同编码


======================
家庭作业1:请思考、补充其它网上存在但搜索引擎搜不到的可能性

家庭作业2:请思考,以上哪些原因,你可以通过调整关键词和搜索策略来施加影响力;哪些原因,你只能接受和顺应? 非常感谢majing老师、diaopi老师的补充,欢迎其它补充。

相 关 文 章
相 关 软 件
没有相关下载
逃生 放生 黄玫瑰 想太多 那滋味 擦肩而过 放手去爱 北京欢迎你 依然在一起 吻得太逼真 感动天感动地 坐上火车去拉萨 怎么会狠心伤害我
心碎 冲动 小太阳 别碰我 蒲公英 千山万水 改变自己 一定要爱你 等爱的玫瑰 陷入爱里面 北极星的眼泪 最后一次的温柔 亲爱的那不是爱情
光荣 火花 坏女人 日不落 樱花草 为你写诗 独家记忆 夏天的味道 寂寞才说爱 忘不掉的伤 爱上你是个错 第三者的第三者 地球人都知道我爱你
假如 相思 是非题 有缘人 舍不得 我的答铃 死而无憾 外滩十八号 越爱越难过 123木头人 和寂寞说分手 爱上你是我的错 爱情里没有谁对谁错
加入收藏留言建议自助友情链接普通友情链接站长的Blog
版权所有   COPYRIGHT 2002-2008 ★IT学习者★ ALL RIGHTS RESERVED.