1.信息分析的对象
信息分析的对象主要有两大类:一类是数值信息,主要指原始及衍生数据(即结构化的二维数据),目的是通过定量分析方法从数据中发现信息、知识、情报、智慧和规律;另一类是非数值信息(半结构化或非结构化信息),主要指事物及其现象,目的是通过定性分析方法从现象中发现事物的本质、属性、特征、规律和联系。
2.信息分析的层次
信息分析工作可以分为两个层次:①数据、信息的搜集和整理。信息分析的对象主要是反映事物或现象属性、特征、本质的原始数据、信息及其衍生数据、信息。而原始数据、信息是零散的、杂乱无章的,需要搜集整理、加工处理后才能变成衍生数据和信息,如数据库、知识库等。因此,信息分析的首要任务是搜集、鉴别、整理原始数据、信息,使其成为可利用的衍生数据和信息。②数据、信息的挖掘和分析。原始及其衍生数据、信息中隐含着大量的规律和关联,只有采用科学的分析方法和程序,利用现代信息技术,对其进行深度挖掘和分析,才能发现其中潜藏的规律、关联和价值,并加以有效利用。
3.信息分析的基础
信息分析主要以事物、现象、数据、信息的属性、特征、本质、规律、关联等为依据展开定性分析和定量分析,以期发现新知识。因此,信息分析以事物、现象、数据、信息之间存在的因果关系或相关关系为基础。关系是指事物之间因为时间、秩序、结构、运动等产生的联系,包括时间、空间、发生和发展逻辑(包括流程,如工业流程、业务流程等;规律,如生命体的生老病死循环、自然运动规律等)。事物、现象、数据、信息之间的关系十分复杂且多种多样,但都可归为不确定性关系和确定性关系两种,不确定性关系主要是相关关系,是定性分析的基础;确定性关系主要是数量关系,是定量分析的基础。
马克思主义唯物辩证法告诉我们,世界是普遍联系的,没有独立存在的现象和事物;小世界现象(六度分隔理论)和社会网络分析法告诉我们,人与人之间也是普遍联系的,通过各种关系形成社会网络;同时,任何事物总是在一定的时间和空间中发生和发展,具有明显的继承性和发展性(扬弃),表现出一定的逻辑关系。事物、现象、数据、信息之间普遍存在的各种关系是进行信息分析的基本依据,尽管有些关系是直接、显在的关系,容易发现,而有些关系是间接、隐含的关系,难以发现。这些关系可能因为时间形成因果关系,是归纳、演绎等信息分析方法的基础;可能因为某一特征形成相似关系,是类比、想象、联想等信息分析方法的基础;可能因为空间形成结构关系,是系统、综合等信息分析的基础;可能因为逻辑形成逻辑关系,是分类、比较等信息分析方法的基础;可能因为数据形成数量关系,是统计学、数学等信息分析方法的基础。
4.信息分析的模式
长期以来,信息分析主要遵循三大基本理念,即样本与总体、定性与定量(函数与相关)、趋势外推,形成了一套思维模式,在“小数据”分析时代发挥了异常重要的作用。
1)样本微观分析。信息分析以数据、信息和现象为对象,一般是从全体或总体中选择部分样本进行分析,称为样本分析或抽样分析。
2)定性和定量分析。以相关关系为基础,采用定性方法分析样本的本质、规律、特征、属性和联系;以因果关系为基础,采用数学和统计学模型定量描述或拟合样本的特征、规律和联系。样本间的定量关系通常不是严格的函数关系,而是近似的函数关系,用函数关系近似地描述相关关系,这样必然存在误差,因此需要对样本间的函数关系进行各种检验,控制误差。
3)趋势外推分析。以定性和定量分析得到的样本的本质、规律、特征、属性、联系等为基础进行趋势外推,扩大到全体或总体,并进行总体预测或估计。