Data

1.プローブデータってどんなデータ?

プローブデータは時間情報と位置情報を一定の間隔で計測、記録したデータです。

具体的にはこんな感じのものです。さて、このデータからどんなことがわかるのでしょうか。

時刻, 緯度, 経度
12:00:00, 35.65923112598702, 139.70075881269076
12;00:05, 35.659289966819934, 139.70060860898593
12;00:10, 35.65908511336254, 139.7006595709572
12;00:15, 35.659209333074934, 139.70085805442432
12;00:20, 35.65918754015692, 139.7010914066086
12;00:25, 35.65942290335684, 139.7008929231415
12;00:30, 35.65949046118426, 139.7009975292931
12;00:35, 35.65900012081641, 139.7007105329285
12;00:40, 35.658823597546935, 139.7005496003876
12;00:45, 35.65910036842535, 139.70070248630145
12;00:50, 35.65919407803296, 139.7005335071335
12;00:55, 35.659346628321735, 139.7004208543549
12;01:00, 35.65917228511078, 139.7007668593178

一見すると、12時ちょうどから1分間、5秒ごとに全部で13回、記録されているようです。ただ、緯度と経度は数値のままだとなんだからよくわからないので、緯度を縦軸に、経度を横軸にしてグラフ(散布図)に表してみます。

点が不規則に散らばっていて、これでもなんだかよくわかりませんね。では次に、このバラバラな点を、時刻の順番で線でつなげてみます。

脈略なくアチコチへ動いてるようですが、それでもまだ、ただの落書きにも見えます。では、この落書きの下に地図を重ねてみます。

これでやっと位置がわかりました。どうやらこのデータは、渋谷駅のハチ公口に12時ちょうどから1分間、ウロウロしているデータのようです。

実は、プローブデータでわかるのはこれだけです。だれがウロウロしていたのか、なぜウロウロしていたのか、その人の年齢、性別、同伴者はいたのかなどは、まったくわかりません。あるいは、人ではなく犬に計測器をつけていたのかもしれませんし、「ウロウロしていた」というのも推測です。どんな計測器を使って得たデータなのかさえもわかりません。そして、地図上に表してみないとどんなデータなのか推測も判別もできないという特性があります。

ここまでのまとめ

プローブデータは、時刻、緯度、経度を一定の間隔で記録したもの。
データだけでは、誰がどんな計測器で記録したのかはわからない。
データの中身を見るときは、地図情報が必要。

2.プローブデータに付加される情報とは?

以上のように、プローブデータは、そのデータだけでわかることが限られています。プローブ技術を使って提供されている位置情報サービスやプローブ情報システムでは、プローブデータ以外のいくつかの情報を組み合わせることによって、移動体の状況をを把握できるように工夫されています。プローブデータに組み合わせる情報には、別の計測器を同時に使用して計測した情報と、集計や分析をするために計測後に組み合わせる情報の2つがあります。以下にその例をいくつか挙げてみます。

(1) 別の計測器を同時に使用して計測する情報

a. 移動体そのものに関連する情報として・・・

移動距離、速度、方位(向き)、回転角、角速度、加速度など

移動距離、速度、方位は、プローブ情報(時刻・緯度・経度)から算出する場合もあります。角速度はジャイロセンサー、加速度は加速度センサーが利用されています。スマートフォンならこれらのほとんどを一台で計測できますね。

b. 周辺状況に関連する情報として・・・

気温、湿度、気圧、放射線量、動画、音声、写真など

これらの情報は、移動中や移動先の周辺状況を知りたいときに、プローブ機器と併用して計測されています。計測する際は時刻も記録しておいて、プローブ情報の時刻と照合して付加します。

c. 運転操作や挙動に関する情報として・・・

ワイパー、アクセル、ブレーキ、ウィンカー等の使用状況、燃料消費量、車間距離など

これらの情報は、車体内にある各種センサーをプローブ機器と接続して計測します。ドライブレコーダーは動画も記録してくれる便利なプローブ機器のひとつです。

(2) 集計や分析をするために計測後に付加する情報

以下に示す情報は、そのほとんどが、移動や時間の経過によって値や内容が変化することはありません。また、移動体そのもの(ユーザー)だけが知り得る情報なので、ユーザーからの申告がないと付加できないという制約があります。

使用機器 機種名、識別番号など
発着地 出発地、経由地、到着地(目的地)など
移動目的 日常的な通勤、通学、買物、職務など
非日常的な旅行(往路・復路・観光・買物など)、趣味(スポーツ・登山・撮影・音楽・芸能・映画・美術など)
移動手段 (プローブパーソンの場合)
航空機、船舶、新幹線、在来線、地下鉄、モノレール、バス、タクシー、乗用車、オートバイ、自転車、徒歩など
(プローブカーの場合)
大型貨物車、小型貨物車、バス、タクシー、乗用車、救急車など
ユーザ属性 (個人の場合)
氏名・性別・年齢・住所・職業・同伴者の有無・購入品目など
(法人の場合)
法人名・職種・資本金・従業員数など

ここまでのまとめ

プローブデータには、必要に応じて付加される情報がある。
別の計測器を同時に使用して付加する情報は、移動体そのもの、周辺状況、運転操作や挙動に関する情報など。
集計や分析をするために計測後に付加する情報は、ユーザーによる申告がないと付加できない。

3.プローブデータは社会資源

上記ではユーザーによる申告がないとわからない情報は付加できないと書きましたが、データの解析を進めていくことで、わからなかったはずの情報がわかってくる場合もあります。

例えば、発着地については、データの始まりを出発地、終わりを到着地、経由地は、一定の時間内で緯度経度の位置が一定の範囲で変化していない場所(停止、滞留している状態)と推定することは不自然ではありません。

一週間分のデータを解析して、平日は同じ時刻に移動(出勤、登校)していて、休日は平日と違う場所へ移動をするという仮定が立証できれば、移動目的もある程度の推測が可能です。

1年間分のデータを解析して、もしも月に一度は映画館に行っていることがわかれば「趣味は映画」と推測してもよいかもしれません。

移動体の属性のうち性別などは、その性別の人しか行かない場所に行っていれば、推測も可能です。例えば、緯度と経度でデパートに行っていることがわかり、の気圧(高度)の変化を見ると3階の婦人服売り場に行っている、などがわかると、そのデータは女性のデータとして見てもよいのかもしれません。

ただし、これらの推測を可能にするには、数多くのサンプル(ユーザー)の、数多くのデータが必要となります。たくさんのデータを集めることが可能なIT系やモバイル系の企業では、スマートフォンから得られるプローブデータを使ってユーザーへのサービスを充実させています。国土交通省もITSの分野で多くのプローブデータを集めることに着手しています。すでにプローブデータは社会的資源となりつつありますね。

4.プローブデータを事例を公開しています

さて、本サイトでは、移動手段に着目し「時刻と緯度と経度と加速度だけで、移動手段を推測できないか、しかも簡単に」という思いで集めたプローブデータの事例を、移動手段ごとに分類し、公開しています。ぜひご覧ください。

プローブデータの事例はArchiveのページでご覧いただけます。


Related posts