出租汽车GPS数据处理

clean_taxi_status(data[, col, timelimit])

从出租车数据中删除乘客携带状态的瞬时变化记录。

taxigps_to_od(data[, col])

输入出租车GPS数据,提取OD信息

taxigps_traj_point(data, oddata[, col])

输入出租车数据和OD数据,提取配送和闲置行程的轨迹点

transbigdata.clean_taxi_status(data, col=['VehicleNum', 'Time', 'OpenStatus'], timelimit=None)

从出租车数据中删除乘客携带状态的瞬时变化记录。这些异常记录会影响旅行订单判断。判断方法:如果同一车辆上一条记录和下一条记录的乘客状态与该记录不同,则应删除该记录。

参数:
  • data (DataFrame) – 数据

  • col (List) – 列名,顺序为[‘VehicleNum’, ‘Time’, ‘OpenStatus’]

  • timelimit (number) – 可选,以秒为单位。如果上一条记录和下一条记录之间的时间小于时间阈值,则将删除该记录

返回:

data1 – 清理后的数据

返回类型:

DataFrame

transbigdata.taxigps_to_od(data, col=['VehicleNum', 'Stime', 'Lng', 'Lat', 'OpenStatus'])

输入出租车GPS数据,提取OD信息

参数:
  • data (DataFrame) – 出租车GPS数据

  • col (List) – 列名在数据中,需要按顺序排列[车辆ID、时间、经度、纬度、乘客状态]

返回:

oddata – OD信息

返回类型:

DataFrame

transbigdata.taxigps_traj_point(data, oddata, col=['Vehicleid', 'Time', 'Lng', 'Lat', 'OpenStatus'])

输入出租车数据和OD数据,提取配送和闲置行程的轨迹点

参数:
  • data (DataFrame) – 出租车GPS数据,col变量指定的字段名

  • oddata (DataFrame) – 出租车OD数据

  • col (List) – 栏目名称,需按顺序排列[车辆ID、时间、经度、纬度、旅客状态]

返回:

  • data_deliver (DataFrame) – 送货行程的轨迹点

  • data_idle (DataFrame) – 空闲行程的轨迹点