태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.
페이지를 읽고 있습니다. ( 아쿠아바다's Blog )
분류 전체보기 (769)
쉐어포인트 (24)
Exchange (12)
SQL (121)
XML (36)
WEB (294)
O / S (97)
삶의향기 (162)
기획 (19)
RSS 피드(IE 7.0부터 기본 지원됩니다. 이전 버전 사용자는 접합한 툴을 사용하세요!!)

검색 방법 - 역인덱스

SQL 2007/06/07 11:33 by 아쿠아바다
역인덱스 방법은

인덱스를 기준으로 데이타를 만드는게 아니라
데이타를 기준으로 인덱스를 뽑아 오는 거죠
검색엔진에서 주로 쓰는 방법입니다.


게시물에서 내용 검색 부분이 힘들죠
%검색% 하면 인데스도 안타고

그래서 모든 단어 인덱스로 하는 테이블을 만듭니다.

게시물이 이렇게 있을때
uid = 1
text = "나는 정말 검색이 싫다"


역인덱스 테이블에서 이렇게 insert를 합니다.
1 1 나는
2 1 정말
3 1 검색이
4 1 싫다



검색할때는 역인덱스 테이블에서 검색을 하면 되겠죠
인덱스 타게끔
검색%

장점이 있으면 단점이 있겠죠
완벽한 검색 방법은 아니라는 것과
(단어별은 검색 가능)
스토리지가 두배 이상으로 쌓인다는 거죠

덧글 :

a
1 나는 정말 검색이 싫다

b
1 나는
2 정말
3 검색이
4 싫다

c a b
1 1 1
2 1 2
3 1 3
4 1 4

이러면 좀 줄어드나요?

그냥 빨랑 마이에스큐엘 4.1이나 5 정식뜨면 풀텍스트인덱스를 걸면 되나요?

그보다 시멘틱웹 룰베이스검색앤진은 아아...


덧글 :

생각해보니 c를 정렬잘시켜 놓으면 a에 텍스트 필드는 없어도 되겠네요.
그럼 인덱스 구성한 경우가 더 용량이 작아 질지도...


덧글 :

또 악간의 온톨로지 계념을 집어넣어서

1 나는
2 정말
3 검색이
4 싫다
5 찾는게
6 서칭이

d b 그룹번호
1 3 1
2 5 1
3 6 1


따위로 동의어 기능의 넣어서 "서칭%" 해도 "검색이","찾는게" 를 포함된 문서가 나오게 해도 좋겠죠.

단순한 형태소 분석을 해서
"검색이","검색을","검색은" 따위를 그냥 "검색"으로 만들어 버리면
용량을 좀더 줄일수 있겠네요.
정확한? 검색은좀 손해보겠지만...


출처 : phpschool

좀더 흥미로운 내용이 많이 있습니다.. HOME > SQL를 확인하세요
TAG ,   
0 Trackback, 0 Comment, :
1  ... 588 589 590 591 592 593 594 595 596  ... 769 
Statistics Graph
Total : 557,403 Today : 33