TransBigData为交通时空大数据而生

_images/logo-wordmark-dark.png

主要功能

TransBigData是一个为交通时空大数据处理和分析而开发的Python包。TransBigData为处理常见的交通时空大数据(如出租车GPS数据、共享单车数据和公交车GPS数据)提供了快速而简洁的方法。它包括栅格化、数据质量分析、数据预处理、数据集计数、轨迹分析、GIS处理、地图底图加载、坐标和距离计算以及数据可视化等通用方法。

技术特点

  • 为交通时空大数据分析的不同阶段提供不同的处理方法。

  • TransBigData的代码简洁、高效、灵活、易用,可以用简洁的代码实现复杂的数据任务。

简介

快速启动

在安装TransBigData之前,请确保你已经安装了geopandas软件包:https://geopandas.org/index.html
如果已安装 geopandas,请直接从命令提示符运行以下代码进行安装
pip install -U transbigdata

以下示例展示了如何使用 TransBigData 从出租车 GPS 数据中快速提取行程 OD

import transbigdata as tbd
import pandas as pd
data = pd.read_csv('TaxiData-Sample.csv',header = None)
data.columns = ['VehicleNum','time','slon','slat','OpenStatus','Speed']
data
_images/WX20211021-192131%402x.png

使用`tbd.taxigps_to_od`方法并传入相应的列名以提取行程 OD:

#Extract OD from GPS data
oddata = tbd.taxigps_to_od(data,col = ['VehicleNum','time','slon','slat','OpenStatus'])
oddata
_images/WX20211021-190104%402x.png

将 OD 聚合到网格中:

#define bounds
bounds = [113.6,22.4,114.8,22.9]
#obtain the gridding parameters
params = tbd.grid_params(bounds = bounds,accuracy = 1500)
#gridding OD data and aggregate
od_gdf = tbd.odagg_grid(oddata,params)
od_gdf.plot(column = 'count')
_images/WX20211021-190524%402x.png

安装

核心方法

基础处理方法

特定数据处理方法