amazonで高値で売れている商品に関するキーワードをデータマイニングするプログラムをpythonで書いてください
ご質問いただきありがとうございます。以下は、Amazonのトップセラー商品からキーワードを取得するPythonスクリプトの例です。プログラムは、AmazonのAPIを使用してトップセラー商品を取得し、商品の説明からキーワードを抽出します。
import requests
from bs4 import BeautifulSoup
import pandas as pd
# AmazonのAPIからトップセラー商品を取得
url = "https://www.amazon.com/gp/bestsellers/?ref_=nav_cs_bestsellers"
html = requests.get(url).text
soup = BeautifulSoup(html, "html.parser")
top_seller_items = soup.find_all("div", {"class": "a-section a-spacing-none aok-relative"})
# 各商品からキーワードを抽出してリストに追加
keywords = []
for item in top_seller_items:
product_url = "https://www.amazon.com" + item.find("a", {"class": "a-link-normal"})["href"]
product_html = requests.get(product_url).text
product_soup = BeautifulSoup(product_html, "html.parser")
description = product_soup.find("div", {"id": "productDescription"}).get_text().strip()
words = description.split()
for word in words:
if len(word) > 3 and word not in keywords:
keywords.append(word)
# 抽出されたキーワードをデータフレームに格納して表示
df = pd.DataFrame(keywords, columns=["Keyword"])
print(df.head())
このスクリプトは、Amazonのトップセラー商品ページから商品のURLを取得し、商品の説明からキーワードを抽出して、データフレームに格納して表示します。このスクリプトを実行するには、requests、BeautifulSoup、pandasのライブラリが必要です。また、AmazonのAPIを使用するためには、APIキーが必要になります。