Ошибка UnicodeDecodeError в Python при чтении файла: как игнорировать ошибку и перейти к следующей строке?

Veloria4881 • 08.04.2025 03:10

346

У меня есть задача прочитать текстовый файл в Python. Кодировка файла следующая:

file -bi test.csv 
text/plain; charset=us-ascii

Это файл стороннего производителя, и я получаю новый каждый день, поэтому предпочел бы не изменять его. В файле есть нестандартные символы, такие как Ö. Мне нужно читать строки с помощью Python, и я могу позволить себе игнорировать строки, содержащие нестандартные символы.

Моя проблема заключается в том, что при чтении файла в Python возникает ошибка UnicodeDecodeError, когда я достигаю строки, где есть нестандартный символ, и я не могу прочитать остальную часть файла.

Есть ли способ избежать этого? Если я попытаюсь сделать так:

fileHandle = codecs.open("test.csv", encoding='utf-8')
try:
    for line in companiesFile:
        print(line, end="")
except UnicodeDecodeError:
    pass

то когда возникает ошибка, цикл for заканчивается, и я не могу прочитать оставшуюся часть файла. Я хочу пропустить строку, которая вызывает ошибку, и продолжить чтение. Я предпочел бы не вносить изменения во входной файл, если это возможно.

Есть ли какой-либо способ это сделать? Большое спасибо.

0 ответ(ов)

Чтобы ответить на вопрос, пожалуйста, войдите или зарегистрируйтесь

Статистика

Задан 08.04.2025

Ответов 0

Похожие вопросы

0 ответ(ов) 290 просмотр(ов)

"TypeError: требуется объект, похожий на bytes, а не 'str' при обработке содержимого файла в Python 3"

python string file +2

0 ответ(ов) 316 просмотр(ов)

Фиксация количества знаков после запятой с помощью f-строк

python python-3.x f-string

0 ответ(ов) 303 просмотр(ов)

Ошибка: "'dict' объект не имеет метода 'iteritems'"

python dictionary python-3.x

0 ответ(ов) 283 просмотр(ов)

Доступ к атрибутам на литералах работает для всех типов, кроме `int`; почему?

python python-3.x language-lawyer +1

0 ответ(ов) 327 просмотр(ов)

Преобразование байтового массива обратно в массив numpy

python python-3.x numpy

Форматирование текста

**жирный текст**
*курсив*
~~зачеркнутый~~
# Заголовок 1
## Заголовок 2

Код

```csharp
public class Example {
    // ваш код
}
```

`строка кода`

Списки

* Маркированный список
* Второй пункт
  * Вложенный пункт

Ошибка UnicodeDecodeError в Python при чтении файла: как игнорировать ошибку и перейти к следующей строке?

0 ответ(ов)

Руководство по Markdown

Форматирование текста

Код

Списки

Поддерживаемые языки программирования

Популярные

Другие .NET

Базы данных