code

CSV 파일과 함께 사용할 수 있는 최소 학습 곡선

starcafe 2023. 6. 12. 21:38
반응형

CSV 파일과 함께 사용할 수 있는 최소 학습 곡선

VBA가 더 이상 안 잘라줘요.저는 많은 계산을 하고 다른 Excel/CSV 파일로 분해해야 하는 대용량 Excel 파일을 많이 가지고 있습니다.

저는 제가 필요로 하는 것을 하기 위해 앞으로 며칠 안에 받을 수 있는 언어가 필요합니다. 왜냐하면 그것은 일종의 비상사태이기 때문입니다.python을 제안받았는데 CSV 파일을 빠르고 쉽게 처리할 수 있는 다른 것이 있는지 확인하고 싶습니다.

Python은 탁월한 선택입니다.csv모듈을 사용하면 CSV 파일을 쉽게 읽고 쓸 수 있으며(Microsoft의 "특이한" 버전이라도) Python 구문을 쉽게 이해할 수 있습니다.

만약 당신이 그것을 신선하게 생각한다면, 저는 실제로 Perl에 반대하는 을 추천합니다.Perl은 확실히 강력하고 빠르지만, 시작하지 않은 사람들에게는 이해할 수 없을 정도로 종종 암호화되어 있습니다.

당신은 어떤 종류의 계산을 해야 합니까?R이 대안이 될 수 있을까요?

편집: 몇 가지 기본적인 예를 들어보겠습니다.

# Basic usage
data <- read.csv("myfile.csv")

# Pipe-separated values
data <- read.csv("myfile.csv", sep="|")

# File with header (columns will be named as header) 
data <- read.csv("myfile.csv", header=TRUE)

# Skip the first 5 lines of the file
data <- read.csv("myfile.csv", skip=5)

# Read only 100 lines
data <- read.csv("myfile.csv", nrows=100)

그 일을 위한 많은 도구들이 있지만, 네, Python은 아마도 요즘 최고일 것입니다.csv 파일을 처리하기 위한 특별한 모듈이 있습니다.공식 문서를 확인합니다.

Python은 확실히 학습 곡선이 작고 csv 파일과 잘 작동합니다.

"계산을 많이 해서 다른 excel/csv 파일로 분류해야 하는 excel 파일"이 있다고 하셨는데, 지금까지 답변한 내용은 모두 csv에 관한 것입니다.

Python에는 다른 사람들이 언급한 것처럼 CSV 읽기/쓰기 모듈이 있습니다.타사 모듈도 있습니다.xlrd(계속) 및xlwt(쓰기) XLS 파일용 모듈입니다.이 사이트의 자습서를 참조하십시오.

VBA 알아요?Visual Basic 2008/2010, 또는 C#이 아닌 이유는 무엇입니까?python이나 ruby와 같은 언어가 작업에 비교적 쉬울 것이라고 확신하지만, 당신은 이미 일을 하는 ".NET 방식"에 익숙하기 때문에 이 작업만을 위해 완전히 새로운 것을 배우는 대신 그들과 계속 일하는 것이 타당합니다.

C# 사용:

var csvlines = File.ReadAllLines("file.csv");

var query = from csvline in csvlines
            let data = csvline.Split(',')
            select new
            {
                ID = data[0],
                FirstName = data[1],
                LastName = data[2],
                Email = data[3]
            };
  1. .NET: Linkq to CSV 라이브러리.
  2. .NET: LINQ를 사용하여 CSV 읽기
  3. Python: CSV 파일 읽기

Perl은 텍스트 스크립트 언어에 매우 효율적입니다. cpan.org 에는 CSV 데이터를 처리하기 위한 수많은 모듈이 있습니다.저는 또한 다른 Perl 모듈로 XLS 형식의 데이터를 작성하고 작성했습니다.만약 당신이 VBA를 사용할 수 있었다면, 당신은 분명히 Perl을 배울 수 있을 것입니다. (Perl의 기본은 쉽지만, 당신이나 다른 사람들도 간결하면서도 암호화된 코드를 작성하는 것은 쉽습니다.)

파일로 수행할 작업에 따라 다릅니다.

파이썬의 학습 곡선은 R보다 덜 가파릅니다.그러나 R에는 특히 통계 목적으로 .csv 파일을 쉽게 조작하는 데 매우 적합한 내장 함수가 많이 있습니다.

편집: 기본 작업(파일 읽기, 행 삭제, 열 삭제 등)이 Python보다 R로 쓰는 것이 조금 더 빠르기 때문에 이 목적으로만 R을 사용하는 것이 좋습니다.

어색하게 한번 해보겠습니다.만약 당신이 윈도우를 실행하고 있다면, 당신은 cygwin 유틸리티를 통해 어색해질 수 있습니다.

이것은 누구에게도 인기 있는 언어 du-jour는 아닐 수 있지만 CSV 파일이 줄 지향적이고 여러 필드로 분할되기 때문에 이를 다루는 것은 어색하기에 완벽한 응용 프로그램입니다.필드로 분할할 수 있는 라인 지향 텍스트 데이터를 처리하기 위해 만들어졌습니다.

사람들이 추천할 대부분의 다른 언어들은 훨씬 더 범용적일 것입니다. 그래서 그 언어들에는 줄 중심의 텍스트 데이터를 처리하는 데 반드시 적용되지 않는 훨씬 더 많은 언어들이 있을 것입니다.

PowerShell에는 CSV 가져오기 기능이 내장되어 있습니다.

이 구문은 매우 추악하지만 프로그래머보다는 관리자에게 더 유용하도록 설계되었습니다. 그러니 누가 알겠습니까, 여러분이 좋아할지도 모릅니다.

그것은 빠른 언어가 되어야 합니다. 좋든 나쁘든 말이죠.

아무도 PowerQuery를 제안하지 않은 것은 놀라운 일입니다. 파일을 Excel로 통합하고 가져오기에 완벽하고 열 계산을 잘 수행하며 그래픽 편집기가 내장되어 있습니다.csvs 및 excel 파일뿐만 아니라 SQL 데이터베이스 및 기타 대부분의 작업에도 사용할 수 있습니다.저는 기본적인 청소 및 포맷 작업을 하루, 어쩌면 며칠 만에 실행할 수 있었습니다(GUI에서 벗어나).

그리고 데이터베이스 작업만 수행하기 때문에 학습할 기능이 거의 없습니다(실제 언어는 "M"이라고 함).

PHP에는 사용하기 쉬운 몇 가지 CSV 기능이 있습니다. http://www.php.net/manual-lookup.php?pattern=csv&lang=en

언급URL : https://stackoverflow.com/questions/3339403/smallest-learning-curve-language-to-work-with-csv-files

반응형