์น ํฌ๋กค๋ง
selenium ํตํด์ web crawling ํด์ slack ๋ฉ์ธ์ง ๋ณด๋ด๊ธฐ
1. selenium, schedule, requests ์ค์น - selenium : ์น ๋ธ๋ผ์ฐ์ ๋ฅผ ์คํํ๊ณ ์ ์ดํ๋ค. ๋ธ๋ผ์ฐ์ ์ ์ง์ ์ ๊ทผํ๋ ๋์ ์น ํ์ด์ง๋์ ์ฌ์ฉ ๊ฐ๋ฅํ๋ค. - reqeusts : ์ธํฐ๋ท์์ ํ์ผ๊ณผ ์น ํ์ด์ง๋ฅผ ๋ค์ด๋ก๋ ๊ฐ๋ฅํ๋ค. - schedule : ํน์ ์์ ์ ์ผ์ ์ ๋ง์ถฐ ์คํํ ์ ์๋๋ก ์ค์ ๊ฐ๋ฅํ๋ค. - beautifulsoup : ์น ํ์ด์ง๋ฅผ ์์ฑํ๋ ํ์์ธ HTML์ ๊ตฌ๋ฌธ ๋ถ์ํ๋ฉฐ ์ ์ ์น ํ์ด์ง๋ง ์ฌ์ฉ ๊ฐ๋ฅํ๋ค. (์ ๊ฐ ํฌ๋กค๋ง ํ ์น ํ์ด์ง๋ ๋์ ์น ํ์ด์ง๋ก ๊ตฌ์ฑ๋์ด ์๊ธฐ ๋๋ฌธ์ selenium์ ์ฌ์ฉํด๋ณด๊ฒ ์ต๋๋ค ๐ค) pip3 install selenium pip3 install requests pip3 install schedule 2. ํน์ URL์ HTML ..
์น ํฌ๋กค๋ง(BeautifulSoup)
1. BeautifulSoup ์ค์น - ์ฌ๊ธฐ์ BeautifulSoup์ ๋ฌด์์ธ๊ฐ? ์์ ์พ...? HTML ๋ฐ XML ํ์ผ์์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ ์ค๊ธฐ์ํ Python ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋๋ค ์ด์์ '์ด์ํ ๋๋ผ์ ์จ๋ฆฌ์ค'์์ ์ ๋๋์๋ค๊ณ ํ๊ณ ์๋ฆ๋ต๊ฒ ์ ๋ ฌํด์ค๋ค๋ ์ ๋์ ์๋ฏธ?! Beautiful Soup Documentation — Beautiful Soup 4.9.0 documentation Non-pretty printing If you just want a string, with no fancy formatting, you can call str() on a BeautifulSoup object (unicode() in Python 2), or on a Tag within it: str(soup) # ' ..