반응형

DataFrame 4

팬더 그룹비와 섬 온리 원 칼럼

팬더 그룹비와 섬 온리 원 칼럼 그래서 데이터 프레임을 가지고 있고,df1, 다음과 같이 보입니다. A B C 1 foo 12 California 2 foo 22 California 3 bar 8 Rhode Island 4 bar 32 Rhode Island 5 baz 15 Ohio 6 baz 26 Ohio 열별로 그룹을 나누고 싶습니다.A그다음에 합열B값을 열에 유지하면서C. 이와 같은 것: A B C 1 foo 34 California 2 bar 40 Rhode Island 3 baz 41 Ohio 문제는 제가 말씀드릴 때 df.groupby('A').sum() 기둥.C제거됨, 반환 B A bar 40 baz 41 foo 34 어떻게 하면 이 일을 피할 수 있고 열을 유지할 수 있을까요?C내가 그룹을..

code 2023.11.04

Pandas Dataframe에서 빈 항목 또는 NaN 항목 찾기

Pandas Dataframe에서 빈 항목 또는 NaN 항목 찾기 팬더 데이터 프레임을 통해 누락된 엔트리 또는 NaN 엔트리가 어디에 있는지 검색하려고 합니다. 다음은 제가 작업하고 있는 데이터 프레임입니다. cl_id a c d e A1 A2 A3 0 1 -0.419279 0.843832 -0.530827 text76 1.537177 -0.271042 1 2 0.581566 2.257544 0.440485 dafN_6 0.144228 2.362259 2 3 -1.259333 1.074986 1.834653 system 1.100353 3 4 -1.279785 0.272977 0.197011 Fifty -0.031721 1.434273 4 5 0.578348 0.595515 0.553483 channe..

code 2023.09.20

판다 콘캣은 nan 값을 만들어냅니다.

판다 콘캣은 nan 값을 만들어냅니다. 팬더에서 두 개의 데이터 프레임을 단순하게 연결하는 이유가 궁금합니다. initId.shape # (66441, 1) initId.isnull().sum() # 0 ypred.shape # (66441, 1) ypred.isnull().sum() # 0 NaN 값이 없는 동일한 모양 및 둘 다의 foo = pd.concat([initId, ypred], join='outer', axis=1) foo.shape # (83384, 2) foo.isnull().sum() # 16943 가입할 경우 NaN 값이 많이 나올 수 있습니다. 이 문제를 해결하고 NaN 값이 도입되지 않도록 하려면 어떻게 해야 합니까?그것을 재현하려고 노력하는 것처럼. aaa = pd.DataFr..

code 2023.09.20

pyspark에서 데이터의 각 행을 루프하는 방법프레임

pyspark에서 데이터의 각 행을 루프하는 방법프레임 예 sqlContext = SQLContext(sc) sample=sqlContext.sql("select Name ,age ,city from user") sample.show() 위 문구는 전체 테이블을 단말기에 출력합니다.하지만 테이블의 각 행에 액세스하려면for아니면while더 많은 계산을 수행할 수 있습니다.당신은 도저히 할 수 없습니다.DataFrames, 다른 분산 데이터 구조와 마찬가지로 반복할 수 없으며 전용 고차 함수 및/또는 SQL 메서드만 사용하여 액세스할 수 있습니다. 물론 가능합니다.collect for row in df.rdd.collect(): do_something(row) 또는 전환.toLocalIterator for..

code 2023.09.15
반응형