다음과 같은 파일이 있다 :   CODE,DATE,TIME,OPEN,HIGH,LOW,CLOSE,VOLUME  000020,20190502,901,9770,9790,9770,9790,98  000020,20190502,902,9830,9830,9830,9830,1  000020,20190502,903,9830,9850,9830,9850,1   그렇다. 이건 하루치 분봉 데이터를 모은 것으로, 46M 정도의 크기이다.   이를 다음과 같이 나이브하게 로드했다:   >>> df=pd.read_csv('test.csv')  sys:1: DtypeWarning: Columns (0) have mixed types. Specify dtype option on import or set low_memory=False.   분봉이므로 9시 1분부터 오후 3시 30분까지 383개 의 데이터가 존재한다.   그런데 다음과 같은 명령으로 조회시 특정 컬럼에 대해서만 개수가 모자라는 현상이 있었다 :  >>> df[df['CODE']=='071970']   262140  071970  20190502  1029  5170  5170  5170   5170       1  262141  071970  20190502  1030  5170  5170  5170   5170       0  262142  071970  20190502  1031  5140  5140  5130   5140     177  262143  071970  20190502  1032  5140  5140  5130...
 
댓글
댓글 쓰기