数据质量分析

data_summary(data[, col, ...])

输出数据集的一般信息。

sample_duration(data[, col])

计算数据采样间隔。

transbigdata.data_summary(data, col=['Vehicleid', 'Time'], show_sample_duration=False, roundnum=4)

输出数据集的一般信息。

参数:
  • data (DataFrame) – 轨迹点数据

  • col (List) – 列名,顺序为[‘Vehicleid’, ‘Time’]

  • show_sample_duration (bool) – 是否输出个别采样间隔

  • roundnum (number) – 小数位数

transbigdata.sample_duration(data, col=['Vehicleid', 'Time'])

计算数据采样间隔。

参数:
  • data (DataFrame) – 数据

  • col (List) – 列名,顺序为[‘Vehicleid’, ‘Time’]

返回:

sample_duration – 列名持续时间的序列,内容是数据的采样间隔,以秒为单位

返回类型:

DataFrame