코알라UNIV2기1 12주차 실제로해보는 프로젝트(classifier , regression) Jupyter Notebook에서 코드짜는 것은 어렵지않았다. 실제로 실습해보니 데이터 사이언스에서 정말로 어려운 것은 두가지로 느껴졌다. 1. 신빙성이 있고 많은 양의 데이터를 어디서 가져와야하는가 2. 그러한 정보가 담긴 데이터를 어떻게 Feature Engineering을 해서 컴퓨터가 학습하게 해야할까 앞으로 해커톤을 생각하면 많은양의 데이터를 가져오고 그것을 가공하는 것이 가장 어렵겠다는 생각이 든다. + immutable vs mutable comparsion['quality']=y_valid #immutable 데이터가담긴 id가 다름 comparsion=y_valid #mutable 데이터가 담긴 id를 가르키고 있음 y_valid=0 했을때 immuable은 comparsion이 정상출력.. 2020. 1. 1. 이전 1 다음