Programming/Python
๋ฌธ์์ด ๋ค๋ฃจ๊ธฐ
1. ์ ์ธ ๋ฐ ์ฃผ์ #๋ฌธ์์ด์ ์ ์ธํ ๋๋ ๋ฐ์ดํ( ' ), ์๋ฐ์ดํ( " )๋ฅผ ์ฌ์ฉํ๋ฉฐ ๋์ ํจ๊ป ์ฌ์ฉํ ์ ์์ >>> test1 = "eunhye" >>> print(test1) eunhye >>> test2 = 'eunhye' >>> print(test2) eunhye >>> test3 = "eunhye' File "", line 1 test3 = "eunhye' ^ SyntaxError: EOL while scanning string literal #ํน์ ๋ฌธ์ ์ถ๋ ฅ์ ์ํด์๋ ์ด์ค์ผ์ดํ ๋ฌธ์๋ฅผ ์ฌ์ฉ >>> test = 'hi\ni\'m eunhye' >>> print(test) hi i'm eunhye ์ด์ค์ผ์ดํ ๋ฌธ์ ์ถ๋ ฅ ๋ฌธ์ \' ๋ฐ์ดํ( ' ) \" ์๋ฐ์ดํ( " ) \t ํญ (tab) \..
selenium ํตํด์ web crawling ํด์ slack ๋ฉ์ธ์ง ๋ณด๋ด๊ธฐ
1. selenium, schedule, requests ์ค์น - selenium : ์น ๋ธ๋ผ์ฐ์ ๋ฅผ ์คํํ๊ณ ์ ์ดํ๋ค. ๋ธ๋ผ์ฐ์ ์ ์ง์ ์ ๊ทผํ๋ ๋์ ์น ํ์ด์ง๋์ ์ฌ์ฉ ๊ฐ๋ฅํ๋ค. - reqeusts : ์ธํฐ๋ท์์ ํ์ผ๊ณผ ์น ํ์ด์ง๋ฅผ ๋ค์ด๋ก๋ ๊ฐ๋ฅํ๋ค. - schedule : ํน์ ์์ ์ ์ผ์ ์ ๋ง์ถฐ ์คํํ ์ ์๋๋ก ์ค์ ๊ฐ๋ฅํ๋ค. - beautifulsoup : ์น ํ์ด์ง๋ฅผ ์์ฑํ๋ ํ์์ธ HTML์ ๊ตฌ๋ฌธ ๋ถ์ํ๋ฉฐ ์ ์ ์น ํ์ด์ง๋ง ์ฌ์ฉ ๊ฐ๋ฅํ๋ค. (์ ๊ฐ ํฌ๋กค๋ง ํ ์น ํ์ด์ง๋ ๋์ ์น ํ์ด์ง๋ก ๊ตฌ์ฑ๋์ด ์๊ธฐ ๋๋ฌธ์ selenium์ ์ฌ์ฉํด๋ณด๊ฒ ์ต๋๋ค ๐ค) pip3 install selenium pip3 install requests pip3 install schedule 2. ํน์ URL์ HTML ..
ํ์ผ ๊ฒฝ๋ก ์ด๋(copy, move)ํ๊ณ ์ญ์ (rm)ํ๊ณ ์์ถ(zip)ํ๊ธฐ
1. shutil ๋ชจ๋ ์ฌ์ฉํ๊ธฐ - copy(), move() >>> import shutil, os >>> os.chdir('/Users/eunhye/Desktop/Workspace') #shutil.copy() : source๋ฅผ destination์ ๋ณต์ฌ #shutil.copy(source, destination) >>> shutil.copy('A.txt', './Test') './Test/A.txt' #destination ์ด๋ฆ์ ์ ์ง๋๊ณ ๋ด์ฉ์ด source ๋ณต์ฌ >>> shutil.copy('B.txt', './Test/AA.txt') './Test/AA.txt' #shutil.copytree() : ๋๋ ํ ๋ฆฌ ํต์ฑ๋ก ๋ณต์ฌ >>> shutil.copytree('.', '../Workspace_Ba..
ํ์ผ ์ด๊ณ (open) ์ฝ๊ณ (read) ์ฐ๊ธฐ(wirte)
1. open() #open() : ํ์ผ ์ด๊ธฐ >>> path = '/Users/eunhye/Desktop/Workspace/test.txt' >>> file = open(path) 2. read() #read() : ํ์ผ ์ฝ๊ธฐ #ํ ์คํธ ํ์์ผ๋ก ํ์ค์ ๋ณด์ฌ์ค >>> fileContent = file.read() >>> fileContent 'test' #readlines() : ํ์ค์ ํ์ผ ์ฝ๊ธฐ #๋ฆฌ์คํธ ํ์์ผ๋ก ๋ณด์ฌ์ค >>> numberFile = open(path2) >>> numberContent = numberFile.read() >>> numberContent '1\n2\n3\n4\n5\n' >>> numberFile = open(path2) >>> numberFile.readlines() [..
OS ๋ชจ๋
1. OS ๋ชจ๋ - ์ด์์ฒด์ ์ ์ ๊ทผํ ์ ์๊ฒ ํด์ฃผ๋ ๋ชจ๋ >>> import os 2. OS ํจ์ #os.path.join : ๊ฒฝ๋ก dir/ํ์ผ์ ๋ฃ์ ๊ฒฝ์ฐ OS์ ๋ง๊ฒ ๊ฒฝ๋ก๋ฅผ ๋ฐํํ๋ ํจ์ #Windows OS์์๋ '\\' Linux OS์์๋ '/'๋ก ๊ตฌ๋ถ >>> os.path.join('Users', 'eunhhye', 'Desktop') 'Users/eunhhye/Desktop' #os.getcwd : ํ์ฌ ๊ฒฝ๋ก๋ฅผ ๋ฐํํ๋ ํจ์ >>> os.getcwd() '/Users/eunhye' #os.chdir : ๊ฒฝ๋ก๋ฅผ ๋ณ๊ฒฝํ๊ธฐ ์ํ ํจ์ >>> os.chdir('Desktop') >>> os.getcwd() '/Users/eunhye/Desktop' >>> os.makedirs('Workspace'..
์น ํฌ๋กค๋ง(BeautifulSoup)
1. BeautifulSoup ์ค์น - ์ฌ๊ธฐ์ BeautifulSoup์ ๋ฌด์์ธ๊ฐ? ์์ ์พ...? HTML ๋ฐ XML ํ์ผ์์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ ์ค๊ธฐ์ํ Python ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋๋ค ์ด์์ '์ด์ํ ๋๋ผ์ ์จ๋ฆฌ์ค'์์ ์ ๋๋์๋ค๊ณ ํ๊ณ ์๋ฆ๋ต๊ฒ ์ ๋ ฌํด์ค๋ค๋ ์ ๋์ ์๋ฏธ?! Beautiful Soup Documentation — Beautiful Soup 4.9.0 documentation Non-pretty printing If you just want a string, with no fancy formatting, you can call str() on a BeautifulSoup object (unicode() in Python 2), or on a Tag within it: str(soup) # ' ..