У меня есть три списка 1 - ссылка, 2 - время прочтения статьи, 3 - автор статьи. Надо как-то объединить их. Еще , если это возможно, то надо сделать функционал для сортировки по времени прочтения и по имени автора. Заранее спасибо.
with open(“html_version_of_sait.html”, encoding=“utf-8”) as file:
src = file.read()
sup = bs(src, “lxml”)
ssilka_got = []
bez_lishnego = sup.find(class_=“cp es cq db cr et cs dd ct eu cu df cv ev cw ew cx ex cy ey l”)
promezutok = bez_lishnego.find_all(“div”, class_=“l er ju”)
for item in promezutok:
all_article_href = item.find(class_=“af ag ah ai aj ak al am an ao ap aq ar as at”)
gotov_href = “https://medium.com” + all_article_href.get(“href”)
ssilka_got.append(gotov_href)
a = sup.find_all(‘span’, string=re.compile(‘min read’))
time_to_read = []
for item in a:
time_to_read.append(item.string.strip())
name_au = []
ntrb = bez_lishnego.find_all(“div”, class_=“jm l”)
for it in ntrb:
name_authorn = it.find(“p”, class_ =“be b gc z ie jo id jp jq jr js jt bj”)
try:
et = name_authorn.text.strip()
name_au.append(et)
except Exception:
et = “-”
name_au.append(et)
name_author_new = list(filter(lambda x: x != ‘-’, name_au))
#ssilka_got - ссылка
#time_to_read - время прочтения
#name_author_new - имя автора