Gephiで新型コロナウイルス患者の感染経路を図化
年末になってしまいました。家族とも話をしていましたが、今年はいったい何だったんだろうと。新型コロナウイルスに振り回された一年でした。今回はこれを図化してみようと思います。
使用するデータ
ネットワーク図としてどれだけ再現できるのかと、関東地方の自治体を数箇所検索してみたのですが、日々の報道のとおり経路不明が多いため、患者同士のエッジがほとんど作成できず、あまり図化する意味がなくなってしまいます。
そこで、当初感染者0人を貫いていた岩手県のデータを利用して作成しました。集計したデータは12月10日公表分までです。首都圏と比べると、経路がわかっているデータが多いように感じました。
なお、集計にあたっては以下の通り整理しています。
【市町村(居住地)について】
居住地が県外・県内と表記されているものは、は「勤務地」「検査した場所」「滞在地」などに読み替え。
【経路について】
ノードの区分のため感染経路を「接触」「家族」「職場」「その他」に分類。多少表現にブレがあるので、そこは適当に判断。
接触…「第××例目の接触者」、「第××例目の濃厚接触者」、「第××例目と業務中に接触」など
家族…「第××例目の家族」、「第××例目の同居家族」、「第××例目の接触者(家族)」、「第××例目の濃厚接触者(同居家族)」、「第××例目の濃厚接触者(別居家族)」、「第××例目の濃厚接触者(家族)」など
職場…「第××例目の接触者(職場関係)」、第××例目の濃厚接触者(職場関係)」、「第××例目の接触者(職場の同僚)」など
その他…記載内容では判断できないもの
【クラスターについて】
報道では数ヶ所のクラスターが発生しているようですが、県のデータでは3つ(クラスターが発生した、または調査中)の飲食店名が記載されていたため、これらを飲食店A、B、Cとして集計。
作図したもの
性別、居住地、感染経路がわかるように表現しました。凡例は次のとおりです。
①居住地別
②クラスター別(紫:飲食店A、青:飲食店B、緑:飲食店C)
③居住地別・感染経路判明のみ抽出
④クラスター別・感染経路判明のみ抽出
まとめ
今回は分析はしていませんが、配置や配色に時間をかけました。とは言え、配置の方法はまだまだ勉強不足です。Gephiの操作方法はだいぶわかってきたので、メモ程度にまとめてみたいと思います。