Варианты парсинга HTML?
В мире .NET я рекомендую html5 HTML Agility Pack. Не так html-content-extraction просто, как некоторые из html-content-extraction вышеперечисленных вариантов html-content-extraction (например, HTMLSQL), но очень html-parsing гибко. Он позволяет манипулировать webpagescraping плохо сформированным HTML, как htmlparser если бы это был хорошо сформированный webpage XML, поэтому вы можете использовать webpage XPATH или просто выполнять webpage итерацию по узлам.
html
web-scraping
html-parsing
html-content-extraction
Варианты парсинга HTML?
Мы используем файлы cookies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cookies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.