随着社会信息化的迅猛提高,网络已经成为大众获取信息的重要来源。而网络信息具有海量,复杂,非结构化等特点,为网络信息的获取以及基于网络信息搜集的分析与研究职业都带来了很大困难。网络信息采集处理平台整合了网络信息获取及处理中的各项关键技术,实现了将复杂、非结构化的网络信息进行整理以及结构化存储的功能。网络信息搜集主要技巧:
1、漫游法2、直接查找法3、搜索引擎法4、网络资源指南法
1.漫游法
(1)偶然发现。这是在因特网上发现、检索信息的原始技巧。即在日常的网络阅读、漫游经过中,意外发现一些有用信息。这种方式的目的性不是很强,具不可预见性和偶然性。
(2)顺“链”而行。指用户在阅读超文这篇文章小编将档时,利用文档中的链接从一网页转向另一相关网页。此技巧类似于传统手工检索中的“追溯检索”,即根据文献后所附的参考文献追溯查找相关的文献,从而不断扩大检索范围。这种技巧可能在较短的时刻内检出大量相关信息,也可能偏离检索目标而空手而归。
2.直接查找法
直接查找法是已经知道要查找的信息可能存在的地址,而直接在浏览器的地址栏中输入其网址进行浏览查找的技巧。此技巧适合于经常上网漫游的用户。其优点是节省时刻、目的性强、节省费用,缺点是信息量少。
3.搜索引穆检索法
此技巧是最为常规、普遍的网络信息检索技巧。搜索引擎是提供给用户进行关键词、词组或天然语言检索的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结局提供给用户。它一般支持布尔检索、词组检索、截词检索、字段检索等功能。利用搜索引擎进行检索的优点是:省时省力,简单方便,检索速度快、范围广,能及时获取新增信息。其缺点是:由于采用计算机软件自动进行信息的加工、处理,且检索软件的智能性不很高,造成检索的准确性不是很理想,与大众的检索需求及对检索效率的期望有一定差距。
4.网络资源指南检索法
此技巧是利用网络资源指南进行查找相关信息的技巧。
网络资源指南类似于传统的文献检索工具————书目之书目(bibliographyofbibliographies),或专题书目,国外有人称之为webofwebs,webliographies,其目的是可实现对网络信息资源的智能性查找。它们通常由专业人员在对网络信息资源进行鉴别、选择、评价、组织的基础上编制而成,对于有目的的网络信息检索具有重要的指导影响。其局限性在于:由于其管理、维护跟不上网络信息的增长速度,使得其收录范围不够全面,创造性、及时性不够强,且用户还要受标引者分类想法的限制。