생성 데이터 인텔리전스

CSV 파일을 PostgreSQL로 가져오는 방법은 무엇입니까?

시간

PostgreSQL은 전 세계 개발자와 비즈니스에서 널리 사용되는 강력한 오픈 소스 관계형 데이터베이스 관리 시스템입니다. PostgreSQL로 작업할 때 가장 일반적인 작업 중 하나는 CSV 파일에서 데이터를 가져오는 것입니다. 이 블로그에서는 CSV 파일을 PostgreSQL 테이블로 가져오는 다양한 방법을 살펴봅니다.

CSV 파일이란 무엇입니까?

CSV는 쉼표로 구분된 값을 나타냅니다. 테이블 형식 데이터를 일반 텍스트로 저장하는 데 사용되는 파일 형식입니다. 파일의 각 행은 데이터 행을 나타내며 행 내의 각 필드는 쉼표로 구분됩니다. CSV 파일은 서로 다른 응용 프로그램과 시스템 간에 데이터를 교환하는 데 널리 사용됩니다.

CSV 파일을 PostgreSQL로 가져오는 이유는 무엇입니까?

PostgreSQL은 데이터 저장 및 관리에 널리 사용되는 선택입니다. 대용량 데이터를 효율적으로 처리할 수 있는 강력하고 확장 가능한 데이터베이스 관리 시스템입니다. CSV 파일에서 PostgreSQL 테이블로 데이터를 가져오는 것은 개발자와 데이터 분석가의 일반적인 작업입니다. PostgreSQL 데이터베이스에 빠르고 쉽게 데이터를 로드할 수 있으므로 분석, 보고 및 기타 용도로 사용할 수 있습니다.

CSV 파일을 PostgreSQL로 가져오는 방법

CSV 파일을 PostgreSQL 테이블로 가져오는 방법에는 여러 가지가 있습니다. 이 섹션에서는 가장 널리 사용되는 몇 가지 방법을 살펴보겠습니다.

방법 1: COPY 명령 사용

COPY 명령은 파일과 테이블 간에 데이터를 복사할 수 있는 강력한 PostgreSQL 명령입니다. CSV 파일에서 PostgreSQL 테이블로 대량의 데이터를 가져오는 빠르고 효율적인 방법입니다. 다음은 COPY 명령을 사용하여 CSV 파일을 PostgreSQL 테이블로 가져오는 단계입니다.

  1. CSV 파일과 동일한 구조로 새 테이블을 만듭니다. 다음 SQL 명령을 사용하여 새 테이블을 만들 수 있습니다.

SQLCREATE TABLE table_name (
column1 datatype,
column2 datatype,
column3 datatype,
...
);

  1. 다음 명령을 사용하여 CSV 파일을 테이블로 가져옵니다.

SQLCOPY table_name FROM '/path/to/csv/file.csv' DELIMITER ',' CSV HEADER;

XNUMXD덴탈의 DELIMITER 매개변수는 CSV 파일에 사용되는 구분 기호를 지정하고 HEADER 매개변수는 CSV 파일의 첫 번째 행에 열 이름이 포함되도록 지정합니다.

방법 2: pgAdmin 사용

pgAdmin은 인기 있는 PostgreSQL용 오픈 소스 관리 및 관리 도구입니다. PostgreSQL 데이터베이스를 쉽게 관리할 수 있는 그래픽 사용자 인터페이스를 제공합니다. pgAdmin을 사용하여 CSV 파일을 PostgreSQL 테이블로 가져올 수 있습니다. 다음은 pgAdmin을 사용하여 CSV 파일을 PostgreSQL 테이블로 가져오는 단계입니다.

  1. pgAdmin을 열고 PostgreSQL 서버에 연결합니다.
  2. CSV 파일을 가져올 데이터베이스를 마우스 오른쪽 버튼으로 클릭하고 '검색어 도구'를 선택합니다.
  3. 검색어 도구에서 다음 SQL 명령을 사용하여 새 테이블을 만듭니다.

SQLCREATE TABLE table_name (
column1 datatype,
column2 datatype,
column3 datatype,
...
);

  1. 도구 모음에서 "가져오기/내보내기" 버튼을 클릭합니다.
  2. "가져오기/내보내기" 대화 상자에서 "가져오기"를 선택합니다.
  3. 가져올 CSV 파일을 선택하고 테이블 이름과 구분 기호를 지정합니다.
  4. "가져오기" 버튼을 클릭하여 CSV 파일을 테이블로 가져옵니다.
검은색 평면 스크린 컴퓨터 모니터
님이 촬영 한 사진 아르투리 잘리 / Unsplash

방법 3: Python 사용

Python은 데이터 분석 및 조작에 널리 사용되는 널리 사용되는 프로그래밍 언어입니다. Python을 사용하여 CSV 파일을 PostgreSQL 테이블로 가져올 수 있습니다. 다음은 Python을 사용하여 CSV 파일을 PostgreSQL 테이블로 가져오는 단계입니다.

  1. Python용 PostgreSQL 어댑터인 psycopg2 패키지를 설치합니다.

pythonpip 설치 psycopg2

  1. 다음 Python 코드를 사용하여 CSV 파일을 PostgreSQL 테이블로 가져옵니다.

파이썬import 사이코프2
import csv 파일

conn = psycopg2.connect(
host="localhost",
database="mydatabase",
user="myusername",
password="mypassword"
)

현재 = conn.cursor()

open('/path/to/csv/file.csv', 'r')을 f로 사용:
판독기 = csv.reader(f)
다음(독자) # 헤더 행 건너뛰기
판독기의 행:
현재.실행(
"INSERT INTO table_name(column1, column2, column3, …) VALUES(%s, %s, %s, …)”,

)

conn.commit()
현재 닫기()
연결.닫기()

방법 4: PostgreSQL용 Cloud SQL 사용

PostgreSQL용 Cloud SQL은 Google Cloud Platform에서 제공하는 완전 관리형 데이터베이스 서비스입니다. 이를 통해 클라우드에서 PostgreSQL 데이터베이스를 쉽게 생성, 관리 및 확장할 수 있습니다. PostgreSQL용 Cloud SQL을 사용하여 CSV 파일을 PostgreSQL 테이블로 가져올 수 있습니다. 다음은 PostgreSQL용 Cloud SQL을 사용하여 CSV 파일을 PostgreSQL 테이블로 가져오는 단계입니다.

  1. PostgreSQL 인스턴스 및 데이터베이스용 새 Cloud SQL을 만듭니다.
  2. Google Cloud Storage에 CSV 파일을 업로드합니다.
  3. 다음 명령을 사용하여 CSV 파일을 PostgreSQL 테이블로 가져옵니다.

SQLCOPY table_name FROM 'gs://bucket-name/path/to/csv/file.csv' DELIMITER ',' CSV HEADER;
XNUMXD덴탈의 gs:// 접두사는 파일이 Google Cloud Storage에 있음을 지정합니다.

다른 방법의 장단점

CSV 파일을 PostgreSQL로 가져오는 방법은 각각 장단점이 있는 다양한 방법을 사용하여 수행할 수 있습니다. 다양한 방법의 장단점은 다음과 같습니다.

방법 1: COPY 명령 사용

장점:

  • CSV 파일에서 PostgreSQL 테이블로 대량의 데이터를 가져오는 빠르고 효율적인 방법입니다.
  • 명령줄을 통해 실행할 수 있으므로 프로세스를 쉽게 자동화할 수 있습니다.

단점 :

  • SQL 및 PostgreSQL 명령줄 인터페이스에 대한 지식이 필요합니다.
  • 데이터 변환 및 검증 측면에서 제한된 유연성.

방법 2: pgAdmin 사용

장점:

  • 사용하기 쉽고 이해하기 쉬운 그래픽 사용자 인터페이스를 제공합니다.
  • 데이터 변환 및 유효성 검사 측면에서 더 많은 유연성을 허용합니다.

단점 :

  • pgAdmin 인터페이스의 제한으로 인해 더 작은 파일 가져오기로 제한됩니다.
  • 큰 파일에 대해 COPY 명령을 사용하는 것보다 느릴 수 있습니다.

방법 3: Python 사용

장점:

  • 데이터 변환 및 검증 측면에서 유연성을 제공합니다.
  • 쉽게 자동화하고 더 큰 데이터 파이프라인에 통합할 수 있습니다.

단점 :

  • Python 및 psycopg2 패키지에 대한 지식이 필요합니다.
  • 큰 파일에 대해 COPY 명령을 사용하는 것보다 느릴 수 있습니다.

방법 4: PostgreSQL용 Cloud SQL 사용

장점:

  • 설정 및 사용이 간편한 완전 관리형 데이터베이스 서비스를 제공합니다.
  • 대용량 파일을 처리할 수 있으며 자동 크기 조정을 제공합니다.

단점 :

  • 클라우드 계정이 필요하며 추가 비용이 발생할 수 있습니다.
  • 데이터 변환 및 검증 측면에서 제한된 유연성.

전반적으로 방법의 선택은 사용자의 특정 요구 사항과 기본 설정에 따라 다릅니다. 작은 파일의 경우 pgAdmin과 같은 방법이 더 적합할 수 있고 큰 파일의 경우 COPY 명령어 또는 PostgreSQL용 Cloud SQL이 더 적합할 수 있습니다.

결론적으로 CSV 파일을 PostgreSQL로 가져오는 것은 개발자와 데이터 분석가에게 일반적인 작업입니다. 명령줄 인터페이스, 그래픽 사용자 인터페이스 및 타사 도구를 포함하여 이 작업을 수행하는 다양한 방법이 있습니다.

이 블로그에서는 pgAdmin, SQL 문, COPY 명령, Python 및 PostgreSQL용 Cloud SQL을 사용하여 CSV 파일을 PostgreSQL로 가져오는 다양한 방법을 살펴보았습니다. 또한 각 방법을 더 잘 이해할 수 있도록 단계별 가이드와 예제를 제공했습니다. 이러한 방법을 사용하여 사용자는 CSV 파일을 PostgreSQL 테이블로 효율적이고 편리하게 가져올 수 있습니다.

spot_img

최신 인텔리전스

spot_img