분류 전체보기845 BeautifulSoup 웹파싱 [ex src]HomeSign up Login soup('input') : 모든 input 태그 반환-> [\n, ] soup('input')[0].string : 첫번째 input 태그의 string 반환-> soup.input['id'] : 첫번째 input태그의 id값 반환-> inputID soup.find_all('a') - 모든 a 태그 반환-> [Home, Sign up , Login] soup.find_all('a')[0].string - 첫번째 a태그의 string 반환-> Home soup.find_all('a')[0]['href'] - 첫번째 a태그의 href값 반환-> index.php 내용추가중.. 2016. 1. 29. Pytesser OCR import PILfrom PIL import Imagefrom pytesser import *import urllib # Downloadurllib.urlretrieve(주소, "codedown.png") # Resizingbasewidth = 300img = Image.open('codedown.png')wpercent = (basewidth/float(img.size[0]))hsize = int((float(img.size[1])*float(wpercent)))img = img.resize((basewidth,hsize), PIL.Image.ANTIALIAS)img.save('resize.png') # Readim = Image.open ('resize.png')text = image_to_stri.. 2016. 1. 27. Cannot send session cookie - headers already sent by 세션오류 session_start() 사용시 다음과 같은 에러가 발생한다면아래와 같이 처리를 해주면 된다. 1. session_start() 를 최상단에 써준다.2. UTF-8 BOM아님으로 저장한다.3. php.ini 에서 output_buffering 을 On 으로 수정해준다. 2016. 1. 24. 웹 에디터 Pingendo 부트스트랩으로 작업좀 하려다가 찾았다.진짜 편하다. 신세계다..필요한거 그냥 끌어다가 놓으면 알아서 생성된다. http://pingendo.com/ 2016. 1. 24. 소켓 통신할때 Response 못받아오는 문제 최근 소켓으로 통신할때 Response를 파싱하는 작업을 진행하다가제대로 받아오지 못하고 깨진 문자열을 반환하는 문제점을 발견했다. 해결법은 간단하다. 받아온 값을 decompress 해주면 해결되더라.(Request 보낼 때 Accept-Encoding 헤더를 지우면 되는경우도 있음) import gzipimport StringIO body = decompress할 값decompress = StringIO.StringIO(body)gzipper = gzip.GzipFile(fileobj=decompress)temp = gzipper.read()print temp 추가로 웹 크롤링 등의 작업을 할 때 gzip 등으로 compress 시켜주면 보다 빠른 속도로 진행이 가능하다고 한다.(서버에서 해당 인코딩.. 2016. 1. 8. Selenium 경로설정 selenium을 사용하고있는데 경로를 잡아주지않으면 오류를 뿜는다.먼저 아래의 주소로 들어가서 OS에 맞게 파일을 다운받는다. (크롬 기준) http://chromedriver.storage.googleapis.com/index.html?path=2.20/ 원하는 경로에 알집을 풀고 PATH를 설정해주면 된다. driver = webdriver.Chrome("C:\chromedriver_win32\chromedriver.exe") 2016. 1. 8. 이전 1 ··· 100 101 102 103 104 105 106 ··· 141 다음