数据处理

数据处理#

我们把**数据处理(Data Handling)**定义为以下四个阶段:

  1. 数据采集(Data Collection)。使用包括网页爬虫在内的各种技术采集互联网数据。

  2. 数据预处理(Data Processing)。使用包括数据清洗、数据转换等方法把数据整理成模型需要的格式。

  3. 数据建模(Data Modelling)。使用统计学、计量经济学、机器学习等方法建模分析。

  4. 数据可视化(Data Visualization)。使用可视化工具和技术,以图表等形式展示数据。