본문 바로가기

example3

[numpy] 넘파이(numpy)의 random 함수를 이용하여 테스트 데이터 생성하는 방법 NumPy에서 랜덤한 값을 생성하는 random에 대해서 알아보겠습니다. random에서 랜덤한 값을 생성하는 함수는 아래와 같습니다. https://numpy.org/doc/1.16/reference/routines.random.html Random sampling (numpy.random) — NumPy v1.16 Manual randint(low[, high, size, dtype]) Return random integers from low (inclusive) to high (exclusive). numpy.org 함수 설명 rand(d0, d1, …, dn) 주어진 차원으로 임의의 값을 반환 randn(d0, d1, …, dn) "표준 정규"분포에서 주어진 차원으로 임의의 값을 반환 randin.. 2020. 4. 23.
[빅데이터] Apache Livy Apache livy는 REST Aapi를 이용해서 스파크 작업을 요청할 수 있는 서비스입니다. REST Api와 자바, 스칼라 라이브러리를 이용해서 작업을 요청할 수 있습니다. 다음의 특징을 가집니다. 멀티 클라이언트에서 여러 개의 스파크 작업을 요청할 수 있음 작업 간 RDD와 데이터 프레임 공유가 가능 여러 개의 스파크 컨텍스트를 관리할 수 있고, 스파크 컨텍스트는 얀이나 메조스 같은 클러스터에서 실행(Livy 서버에서 실행되지 않음) 스파크 작업은 JAR, 자바/스칼라 API, 코드 조각을 통해 요청 보안 통신을 이용해 안정성 제공 REST API 요청 방법 # POST 방식으로 작업 실행 # curl 옵션 -X: 전송방식, -H: 헤더정보추가 -d: POST 파라미터(json 형식) # file.. 2020. 3. 10.
[python][bs4] BeautifulSoup 사용 예제 beautifulsoup을 이용하여 HTML을 파싱하는 방법을 알아보겠습니다. bs4의 주요 객체 A B C Tag HTML Tag 객체 로 둘러쌓인 객체 NavigableString Tag 밖의 문자, 개행 문자 문자 B Comment 등 HTML 주석 BeautifulSoup HTML 문서 그 자체 예제 태그의 id, class 정보를 이용하여 찾는 방법 태그 애트리뷰트 정보를 이용하여 찾는 방법 Tag객체의 정보를 확인하는 방법 2019. 9. 27.