다음과 같은 파일이 있다 : CODE,DATE,TIME,OPEN,HIGH,LOW,CLOSE,VOLUME 000020,20190502,901,9770,9790,9770,9790,98 000020,20190502,902,9830,9830,9830,9830,1 000020,20190502,903,9830,9850,9830,9850,1 그렇다. 이건 하루치 분봉 데이터를 모은 것으로, 46M 정도의 크기이다. 이를 다음과 같이 나이브하게 로드했다: >>> df=pd.read_csv('test.csv') sys:1: DtypeWarning: Columns (0) have mixed types. Specify dtype option on import or set low_memory=False. 분봉이므로 9시 1분부터 오후 3시 30분까지 383개 의 데이터가 존재한다. 그런데 다음과 같은 명령으로 조회시 특정 컬럼에 대해서만 개수가 모자라는 현상이 있었다 : >>> df[df['CODE']=='071970'] 262140 071970 20190502 1029 5170 5170 5170 5170 1 262141 071970 20190502 1030 5170 5170 5170 5170 0 262142 071970 20190502 1031 5140 5140 5130 5140 177 262143 071970 20190502 1032 5140 5140 5130...
댓글
댓글 쓰기