パーソナルブログメモリ

a = [1, 1]
for _ in "*" * 999: a += [sum(a[-2:])]
print(a)

国際がん研究機関 の発がん性リスクデータをスクレイピングしてみる

2019-11-11 | Python

PygameでRPGのマップを作ろうとしていてなぜか発ガン性物質についてのデータスクレイピングしていた話

 

「無限に都市が生成されるアルゴリズム」で生成された都市を自由に歩き回ってみた

このタイトルの記事で紹介されたサイトに驚かされるUnityで自動生成された3Dの建築物の中を歩き回れます。

あまりにすごすぎて...当初の目的は保留。

ubuntu18.04でUnityとかも入れていない状態で、そのまま動かせました。

移動しただけどんどん自動生成していくようです。終了のさせ方がわからず焦りましたが、ALT+F4で終了です。

 

 

自動生成を調べて別のサイトを見ていて、こんな記事を見かけて

コーラに含まれる発がん性物質「4-MI」

 

国際がん研究機関(IARC)へ行ってみました。

IARC Monographs on the Identification of Carcinogenic Hazards to Humans

こちらのサイトからCSVデータをダウンロードしてみましたが全部英語なので

ダウンロードしたデータをa.csvとしてデータ加工してみました。

 

データはを改行コードで分割、カンマで分割、さらにシングルクォーテーションとダブルクォーテーションでくくられていたので取り外します。

データを軽くみて、項目の3番目にガンの危険度の高さから1、2A、2B、3と分類されいて、その時の原因物質、行動などが項目の2番目だったので

1、2A、2Bごとに項目の2番目を表示しています。

それをgoogle翻訳にペタリ。

危険度の1の一部がこちら

 

 

スクレイピングに使った簡単なプログラムはこちらです。

 

import csv
#a.csvの読み込み
l=[]
with open('./a.csv') as f:
    l=f.read().replace("\"","").replace("\'","").split("\n")

print("グループ1:作因(Agent)は、ヒトに対して発癌性である(ヒトでの十分な証拠)")
for i in l:
    c=i.split(",")
    if c[2]=="1":print(c[1])

print("グループ2A:作因は、ヒトに対して恐らく(probably)発癌性である(ヒトでの限られた証拠,実験動物での十分な証拠)")
for i in l:
    c=i.split(",")
    if c[2]=="2A":print(c[1])

print("グループ2B:作因は、ヒトに対して発癌性であるかも(possibly)知れない(ヒトでの限られた証拠,実験動物での十分より少ない証拠)")
for i in l:
    c=i.split(",")
    if c[2]=="2B":print(c[1])

 

 

 


最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。