beautifulsoup ×3
Создан 06.01.2025
5
голоса
5
ответов
15
просмотров
UnicodeEncodeError: кодек 'charmap' не может закодировать символы

Я пытаюсь сделать парсинг сайта, но возникла ошибка.

Я использую следующий код:

import urllib.request
from bs4 import BeautifulSoup

get = urllib.request.urlopen("https://www.website.com/")
html = get.read()

soup = BeautifulSoup(html)

И получаю следующую ошибку:

File...
6
голоса
5
ответов
25
просмотров
Как найти элементы по классу

Я сталкиваюсь с проблемой при парсинге HTML-элементов с атрибутом "class" с помощью BeautifulSoup. Код выглядит следующим образом:

soup = BeautifulSoup(sdata)
mydivs = soup.findAll('div')
for div in mydivs: 
    if (div["class"] == "stylelistrow"):
        print div

Я получаю ошибку...

15
голоса
5
ответов
36
просмотров
UnicodeEncodeError: 'ascii' кодек не может закодировать символ u'\xa0' на позиции 20: номер не в диапазоне (128)

Я столкнулся с проблемами при работе с юникодными символами из текста, полученного с разных веб-страниц (на разных сайтах). Я использую библиотеку BeautifulSoup.

Проблема в том, что ошибка не всегда воспроизводима; иногда код работает с некоторыми страницами, а иногда выбрасывает ошибку...