본문 바로가기
Project/SwiftUI 블록와이드

[SwiftUI Projetct] swiftsoup 크롤링 문제 발생 기록

by iOS_woo 2022. 12. 6.

언론사 로고 이미지가 누락되었다.

잘 표시되던 언론사 로고 이미지가 누락되어서 보여집니다.

에러 기록

정상이라면 로고 이미지의 url이 표시되어야 하지만 

data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7

라는 string으로 대체되어 있는 상황입니다.

 

base64string을 stirng으로 변환을 시도해봤지만 변화가 없었습니다. 

 

크롤링해오던 html을 천천히 살펴보니 해당 문구가 img가 없을 때 대체되어 보여지는 onerror로 정의되어 있음을 확인할 수 있었습니다. 

 

html

초기에는  src의 url을 정상적으로 가져왔지만 어느시점부터는 onerror를 가져오는 것이었는데요. 

 

swiftsoup로  onerror가 아닌 src만을 가져오는 방법을 찾지 못하겠어서.. 

(swiftsoup 자료가 너무 부족하네요 ㅠㅠ ) 

 

우선은 로고 이미지가 onerror로 대체된다면 UI에서 이미지 위치를 제거하는 식으로 임시 처리해야 할 것 같습니다.

onerror를 보여주는 것이라 크롤링 하던 사이트의 일시적인 장애 현상인지, 완전히 막힌 것인지를 알 수가 없네요.. ㅠㅠ

 

파이썬 크롤링으로는 해결방법이 있어 보이던데 파이썬을 사용하려면 서버를 만들어야해서 훗날 생각해야 할 것 같아요. 

 

수정된 코드:

댓글