[AWS-EMR] EMR 일관성 보기 설정

2019. 8. 6. 19:41·AWS/EMR

EMR에서 S3에 데이터를 저장할 때 S3가 데이터 일관성을 지원하지 않기 때문에 같은 위치에 동시에 데이터를 쓰게 되면 데이터가 유실될 위험이 있습니다.

 

예를 들어 s3://[bucket]/a/b/c 위치에 한번에 100개 정도의 파일을 쓰게 되면 100개의 파일이 생성되지 않고, 파일이 유실되어 99개의 파일이 생성될 수 있습니다.

 

Amazon S3 데이터 일관성 모델 참고

 

Amazon S3 소개 - Amazon Simple Storage Service

Amazon S3 소개 본 Amazon Simple Storage Service(Amazon S3) 소개는 이 웹 서비스에 대한 세부 요약 정보를 제공합니다. 이 단원을 읽으면 이 제품의 혜택과 사업에의 적용 방법을 이해하게 됩니다. Amazon S3 및 이 안내서의 개요 Amazon S3에서 제공하는 단순한 웹 서비스 인터페이스를 사용하여 웹에서 언제 어디서나 원하는 양의 데이터를 저장하고 검색할 수 있습니다. 이 안내서에서는 버킷을 만들고, 객체를 저

docs.aws.amazon.com

 

이를 방지하기 위해서 EMRFS 일관성 보기를 지원합니다. DynamoDB를 이용하여 키를 관리하여 동시에 생성되는 것을 방지합니다. 사용방법은 /etc/hadoop/conf 아래에 emrfs-site.xml파일을 생성하고 다음을 설정합니다.

<?xml version="1.0" ?>
<configuration>
    <property>
        <name>fs.s3.consistent</name>
        <value>true</value>
    </property>
    <property>
        <name>fs.s3.consistent.retryPeriodSeconds</name>
        <value>10</value>
    </property>
    <property>
        <name>fs.s3.consistent.retryCount</name>
        <value>5</value>
    </property>
    <property>
        <name>fs.s3.consistent.metadata.tableName</name>
        <value>EmrFSMetadata</value>
    </property>
</configuration>
반응형
저작자표시 비영리 동일조건 (새창열림)

'AWS > EMR' 카테고리의 다른 글

[EMR] AWS EMR의 버전 선택  (0) 2019.11.01
[AWS-EMR] EMR의 하이브메타스토어 재시작  (0) 2019.10.10
[AWS-EMR] EMR에서 ResourceManager 같은 서비스 목록 확인, 시작 및 종료  (0) 2019.07.18
[AWS] EMR에서 S3의 데이터를 확인하는 경우 AWS 커맨드 추천  (0) 2016.08.12
[AWS/EMR] AMI v4.x 대의 포트 변경  (0) 2015.08.13
'AWS/EMR' 카테고리의 다른 글
  • [EMR] AWS EMR의 버전 선택
  • [AWS-EMR] EMR의 하이브메타스토어 재시작
  • [AWS-EMR] EMR에서 ResourceManager 같은 서비스 목록 확인, 시작 및 종료
  • [AWS] EMR에서 S3의 데이터를 확인하는 경우 AWS 커맨드 추천
hs_seo
hs_seo
Hello World!
    반응형
  • hs_seo
    개발자로 살아남기
    hs_seo
  • 전체
    오늘
    어제
    • 전체 (1139)
      • 개발자 (21)
        • 개발에 유의할 점 (0)
        • 면접 (5)
      • IT 소식 (5)
        • 업계 (1)
      • java (51)
        • 디자인패턴 (3)
        • apache-common (1)
      • 개념 (47)
        • 자료구조 (4)
        • 함수형사고 (8)
        • 디자인패턴 (1)
      • 데이터분석 (1)
      • python (67)
        • 코드조각 (12)
        • 라이브러리 (2)
      • 빅데이터 (417)
        • zookeeper (5)
        • hadoop (78)
        • hdfs (12)
        • hive (127)
        • hbase (16)
        • spark (40)
        • scala (4)
        • trino (3)
        • oozie (41)
        • Hue (9)
        • R (5)
        • sqoop (6)
        • flume (3)
        • elasticsearch (2)
        • airflow (15)
        • kafka (3)
        • kubernetes (10)
        • openstack (3)
        • flink (2)
        • redis (2)
      • 빅데이터 강좌 (2)
      • 알고리즘 (131)
        • 알고리즘 (1)
        • 백준 (61)
        • 정올 (41)
        • 더블릿 (5)
        • 프로그래머스 (1)
      • 프로그래밍 언어 (30)
        • go (4)
        • js (9)
        • .Net (6)
        • Jsp (1)
        • ansible (3)
        • terraform (6)
      • Tools (56)
        • docker (2)
        • macbook (6)
        • maven (3)
        • sublime (1)
      • 프레임워크 (25)
        • [JS] angularjs (2)
        • [JS] node.js (19)
        • [Java] spring (2)
        • Android (2)
      • 데이타베이스 (43)
        • SQLD (5)
        • Oracle (1)
        • MySQL (8)
        • ADsP (2)
      • 리눅스 (25)
        • Bash (61)
      • GCP (5)
      • AWS (34)
        • EC2 (2)
        • EMR (14)
      • 정보보안기사 (4)
        • 네트워크 (1)
      • 개인 (80)
        • 업무실수 (0)
        • 책 (9)
        • 교육 (3)
        • 여행 (17)
        • 영화 (12)
        • 음악 (2)
        • 피규어 (4)
        • 게임 (3)
        • 생각 (7)
        • 기타 (10)
        • 좋은글 (5)
        • 좋은 사이트 (2)
  • 블로그 메뉴

    • 홈
    • 태그
    • 미디어로그
    • 위치로그
    • 방명록
  • 링크

    • 빅데이터-하둡,하이브로 시작하기
    • 빅데이터-스칼라, 스파크로 시작하기
    • Kaggle에서 파이썬으로 데이터 분석 시작하기
    • 쉘스크립트 개발 시작하기
    • 개발자가 데이터 분석 준전문가 되기
    • 데브쿠마
  • 공지사항

  • 인기 글

  • 태그

    HIVE
    Python
    AWS
    build
    emr
    S3
    백준
    Tez
    hbase
    oozie
    Hadoop
    Linux
    다이나믹
    알고리즘
    오류
    SPARK
    yarn
    mysql
    하둡
    파이썬
    HDFS
    java
    airflow
    error
    bash
    nodejs
    k8s
    하이브
    정올
    ubuntu
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
hs_seo
[AWS-EMR] EMR 일관성 보기 설정
상단으로

티스토리툴바