된다면...
lucene으로 멀티서버 클러스터만 구현한다면 대용량에서도 변동되는 DB 필드처럼 리얼타임 랭킹이 가능할건데...
음. 언제 제대로 살펴보려나...
해도 해도 끊이 없는 루씬의 세계로다...
by typos | 2007/03/21 01:39 | 루씬 접목기 | 트랙백 | 덧글(3)
트랙백 주소 : http://lucene.egloos.com/tb/1531292
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Commented by kim at 2007/05/21 03:02
부탁좀 드려도 될까요?
전 지금 한달째 나름대로 각종 검색엔진으로 너치를 윈도우2003에 설치하고 싶어자료를 찾고 있습니다.
그런데 고수 또는 중수 ^^; 도 아닌 저가 아무리 찾아도 배껴스는 자료도 찾을 수가 없네요..
지능형 검색엔진을 만들려고 하는데요.
윈도우에 너치를 설치할 수 있는 설치방법에 관해 아무거나 부탁드리고 싶습니다. ^_^

아님. 네이버에(아무 검색엔진이라도) 질의를 던지고 값을 받아서 DB에 저장(HTML원본)하는 거라도 ^^;;;
현제 윈도우2003에 톰캣 아파치 오라클 깔려있고 DB와 연동되어 있습니다.

참.. 질문을 드려도 될까요^^;
너치를 설치하고 나서 가령 형태소분석기라든지 오라클DB를 사용한다던지 너치를 가공하는게 어려운가요?
너무 초보적인 질문에 당혹하셨을 듯 ^^;;
부탁좀 ^^; 드릴께요.. 천천히 대답해주셔도 되요. 나름대로 또 찾아보고 있겠습니다.
Commented by typos at 2007/05/21 13:01
너치는 작년쯤 대략 구조만 살펴보고 답이 아니라서 일단 손놓은터라 정확히 말씀드리기는 어렵고요. nutch에서의 비슷한 문제는 이번에 해결하려고 합니다. 너치는 hadoop과 lucene로 이루어진 응용어플리케이션이므로 분석하기가 그렇게 쉽진 않습니다. 윈도우에서의 설치문제는 www.jaso.co.kr 에 보시면 hadoop관련 설치시 고쳐야할 부분이 있습니다. h/w usage부분인데 리눅스용이라 윈도우에선 안먹습니다. 그 위에 nutch가 돌아갈것 같은데 저도 nutch를 프로젝트로 돌리질 않아서 장담은 못하겠고요. 제가 볼때는 님께서는 차라리 http관련 클래스를 찾아서 하시는게 빠를듯 합니다. 이 블로그는 갱신되지 않습니다. 앞으로 www.lucene.co.kr로 질문주시기 바랍니다.
Commented by kim at 2007/05/21 15:58
그렇군요..
말씀 감사합니다.
일단 더 찾아보고 안되면 http 관련 클래스쪽으로(이것도 찾고 있슴) 넘어가야 겠네요..
그러나 검색엔진을 개인이 만들 수 없으므로 검색쪽을 하기위해 리눅스로 넘어갈 수 밖에 없다는
생각을 합니다. 지금은 그냥 테스트용 이라서 가볍게 접근할 생각 이었는데 갈수록
무거워 지네요 ^^;;;;
말씀 고맙구요.. 좋은하루 되세요.

:         :

:

비공개 덧글

< 이전페이지 다음페이지 >