본문 바로가기

공부방/Elasticsearch

(30)
elasticsearch - search 실습 자료는 아래에서 받으실 수 있습니다. https://github.com/minsuk-heo/BigData/blob/master/ch03/simple_basketball.json 두개의 정보가 들어가 있는 파일이 존재한다. (simple_basketball.json) 한개는 점수가 30점, 한개는 점수가 20점이다. 아래의 코드로 bulk 데이터를 저장해보자 curl -XPOST 'localhost:9200/_bulk?pretty' --header 'content-type: application/ json' --data-binary @simple_basketball.json 저장한 데이터를 다시 조회해보자. curl -XGET localhost:9200/basketball/record/_search?..
elasticsearch - 매핑 (mapping) 실습 자료는 아래에서 받을 수 있습니다. https://github.com/minsuk-heo/BigData/blob/master/ch02/classesRating_mapping.json https://github.com/minsuk-heo/BigData/blob/master/ch02/classes.json 키바나를 더 잘 활용하기 위해 data의 타입을 명시해주는 것이 필요하다. classes index를 새로 만들어주고 시작하자 기존에 classes index를 만들어 놓은 것이 있다면 지우고 다시 실습해보자. curl -XPUT "http://localhost:9200/classes" 만들어진 인덱스를 조회해보자 curl -XGET "http://localhost:9200/classes"?prett..
elasticsearch - bulk 위 데이터는 아래에서 받을 수 있습니다. https://github.com/minsuk-heo/BigData/blob/master/ch02/classes.json bulk 파일은 아래와 같은 정보를 가지고 있다. index와 id에 대한 정보와 본문에 대한 정보를 2줄에 걸쳐 가지고 있다. 이를 이용하여 elasticsearch에 내용을 저장해보자. curl -XPOST http://localhost:9200/_bulk --header 'content-type: application/json' --data-binary @classes.json 아래의 명령어로 본문 내용이 잘 들어갔는지 확인해보자. curl -XGET http://localhost:9200/classes/class/1/?pretty cur..
elasticsearch - update curl -XPOST http://localhost:9200/classes/class/1/ -d '{"title" : "Algorith", "professor" : "John"}' -H "Content-Type: application/json" 내용 추가 curl -XPOST http://localhost:9200/classes/class/1/_update -d '{"doc" : {"unit" : 1}}' -H "Content-Type: application/json" 값 변경 방법1 curl -XPOST http://localhost:9200/classes/class/1/_update -d '{"doc" : {"unit" : 2}}' -H "Content-Type: application/json" cu..
elasticsearch - CRUD 가장 기본이 되는 데이터 저장을 알아보겠습니다. 기존 RDB와는 용어도 약간씩 다르고, 삽입하는 방법도 약간 다르지만 쉽게 따라할 수 있도록 되어있습니다. http:// IP : port / Index / Type / id값 ex) http://localhost:9200/test/dog/1 classes index 조회 classes index가 존재하는지 아래의 커맨드를 이용하여 확인해 보자. curl -XGET http://localhost:9200/classes?pretty status 404: index를 만들어 준 적이 없기 때문에 찾을 수 없다고 나타남. classes index 생성 이번에는 classes index를 생성해보고 잘 만들어졌는지 확인까지 해보도록 하자. curl -XPUT h..
elastic search 검색엔진의 시초, Lucene 모든 검색엔진의 시초는 루씬(Lucene). 더그 커팅이 고안한 역색인(Inverted Index) 구조인 아파치 루씬을 기반으로 분산처리를 가능하게 한 아파치 솔라(Solr)가 등장해서 검색엔진 시장을 장악했고, 몇 년 후에 역시 루씬을 기반으로 한 Elastic Search가 등장해 지금은 검색엔진 분야에서 지배적인 위치에 있다. 서치엔진 순위 트렌드. 2016년 무렵부터 ES가 가장 많이 사용되고 있다.(https://db-engines.com/en/ranking_trend/search+engine) ES와 RDBMS 조금 더 쉬운 개념 파악을 위해서 ES에서 사용되는 데이터 구조를 RDBMS에 대응해보면 다음과 같이 맵핑된다. 데이터 구조 Elastic Search는..