我正在运行python-BeautifulSoup代码以从网站获取商品价格数据。我面临的问题是输出中包含不必要的“ \ n”和空格,前者我无法将其删除。
我可以使用.replace
函数删除空格,但是不适用于“ \ n”。
代码如下:
from bs4 import BeautifulSoup
import requests
import html5lib
URL= "https://tradingeconomics.com/commodities"
response=requests.get(URL)
soup=BeautifulSoup(response.content,'html5lib')
print(soup)
C1=soup.find(class_='table table-hover table-striped').find('tbody')
C2=C1.find_all('tr')
for tr in C2:
td=tr.find_all('td')
row=[i.text for i in td]
row=str(row)
row=row.replace(' ','').replace("\n",'')
print(row)
这是我当前得到的输出:
['\n\n','\n\nUranium\n\n\n','\n\n24.0500\n','\n\n0.20\n','\n0.84%\n','\n-0.21%\n','\n-5.32%\n','\n-16.35%\n','\nNov/01\n']
这是我想要的输出,其中不包括\n
:
['','Uranium','24.0500','0.20','0.84%','-0.21%','-5.32%','-16.35%','Nov/01']
非常感谢。