본문 바로가기

전체 글30

북한산! 백운대! 일주일만 지나면 가을을 뒤집고 겨울이 된다는 말을 직원으로 부터 들었다. 올해는 산이라고는 한번을 가지않아서, 친구를 꼬드겨 북한산에 처음 가기로하였다. 서울 북쪽 끝 노원구에 있는 북한산우이역을 시작으로 백운대 정상까지 찍는 백운대 코스를 정하여서 빠르게 갔다오고자했다. 일요일 아침에 일어나는 것은 산을 오르는 것보다 힘든 일이기때문에 우리는 오후2시에 만나서 출발하기로했다. 대략 시간을 보니 신도림에서 북한산우이역까지 2시간. 왕복 3시간 이기때문에 돌아오는 길은 야간산행이 될 것 같아 랜턴과 겉옷을 잘 챙겨갔다. 오늘 이날을 잊지 못할 것 같다. 왜냐하면 산에서 겪을 수 있는 모든 상황은 다 겪었기 때문이다. 북한산에 오르기 시작한지 20분이 되는차에 비가 추적추적 오기시작하더니, 마치 우리의 산행.. 2019. 11. 4.
4주차 데이터를 저장하는 방법 시험이 끝나고, 오랜만에 다시만났다. 내색하진않았지만 알수없는 반가움이 있었다. 3주차에서 "크롤링한 데이터를 출력하기"까지 배웠다면, 4주차에서는 그 데이터를 앞으로 활용하기위해서 저장하는 방법에대해서 배웠다. 저장할 파일형식은 csv와 xlsx 두가지가 있다. csv는 쉼표와 줄바꿈을 기준으로 데이터를 분류하는 파일로 가볍다는 특징이 있다. (+11/28 csv는 int는 저장할 수 없고string만 저장가능) xlsx는 우리가 정말 많이 사용하는 엑셀파일로써 활용할 수 있는 방법이 많다. csv xlsx import X openpyxl 문자열 전처리 O (replace(",","")가 강제됨) X 시작과 끝 f=open("파일명","w') f.write() f.close() wb=openpyxl.W.. 2019. 11. 1.
3주차 파이썬으로 데이터 수집하기 매주차에 배우는 양은 정량적이지만, 기존의 알고있던것과 접목되면서 새로이 알게되는 정보와 생겨나는 오류들은 나의 머리속을 주머니속에서 꼬인 이어폰 줄처럼 꼬이게 한다. 배움이 커질 수록 이해는 올라가지만 복잡도는 기하급수적으로 증가한다. 그래서 글을 작성하면서 다시 정리하고자한다. -모임전 정리 우리는 requests와 BeautifulSoup를 이용해서 크롤링을 한다. 다양한 페이지를 크롤링하면서 두 라이브러리의 모듈과 익숙해졌다. 또 "Container와 선택자를 어떻게 잡아야하는가" 에대한 깊은 고민 끝에 어느정도 최적화를 시킬 수 있었다. (->네이버 블로그에 개인적으로 정리해놓음) 자잘구래한 생각과 정보를 얻게 되었는데, 그것을 나열하고자한다. Requests와 BeautifulSoup에 관하여.. 2019. 10. 17.
2주차 데이터수집을 위한 기초 파이썬 2019/10/9 한글날에도 학교 도서관은 꽉 차있다. 오늘 15년만에 최저 온도를 다시 갱신했다고 했는데, 도서관은 공부에 대한 열기로 뜨겁다. 마찬가지로, 휴학중인 나와는 달리 우리팀원들은 학교 공부와 알바 혹은 전공관련 프로젝트 또 각자의 취미생활에 더해서 코알라유니브 활동까지 하고있다. 뛰는시간속에 날고 있는 우리 팀원들을 보면서 나도 꾸준히 걸어야겠다는 생각을 한다. 빈칸 빈칸 빈칸 2주차 정리 요번 주는 내가 배운 내용을 정리하는 순서여서 우리 팀원들에게 전달하려고한 Script를 그대로 복붙함 1주차에서는 HTML의 구성과 / HTML에서 컨테이너와 선택자를 설정하는 방법을 배움 3주차에서 데이터를 수집하는 코딩을 파이썬 하기때문에, 2주차에서는 파이썬에 대해 알아보려고 함. 먼저 파이썬은 .. 2019. 10. 9.