인덱스를 기준으로 데이타를 만드는게 아니라
데이타를 기준으로 인덱스를 뽑아 오는 거죠
검색엔진에서 주로 쓰는 방법입니다.
게시물에서 내용 검색 부분이 힘들죠
%검색% 하면 인데스도 안타고
그래서 모든 단어 인덱스로 하는 테이블을 만듭니다.
게시물이 이렇게 있을때
uid = 1
text = "나는 정말 검색이 싫다"
역인덱스 테이블에서 이렇게 insert를 합니다.
1 1 나는
2 1 정말
3 1 검색이
4 1 싫다
검색할때는 역인덱스 테이블에서 검색을 하면 되겠죠
인덱스 타게끔
검색%
장점이 있으면 단점이 있겠죠
완벽한 검색 방법은 아니라는 것과
(단어별은 검색 가능)
스토리지가 두배 이상으로 쌓인다는 거죠
덧글 :
a
1 나는 정말 검색이 싫다
b
1 나는
2 정말
3 검색이
4 싫다
c a b
1 1 1
2 1 2
3 1 3
4 1 4
이러면 좀 줄어드나요?
그냥 빨랑 마이에스큐엘 4.1이나 5 정식뜨면 풀텍스트인덱스를 걸면 되나요?
그보다 시멘틱웹 룰베이스검색앤진은 아아...
덧글 :
생각해보니 c를 정렬잘시켜 놓으면 a에 텍스트 필드는 없어도 되겠네요.
그럼 인덱스 구성한 경우가 더 용량이 작아 질지도...
덧글 :
또 악간의 온톨로지 계념을 집어넣어서
1 나는
2 정말
3 검색이
4 싫다
5 찾는게
6 서칭이
d b 그룹번호
1 3 1
2 5 1
3 6 1
따위로 동의어 기능의 넣어서 "서칭%" 해도 "검색이","찾는게" 를 포함된 문서가 나오게 해도 좋겠죠.
단순한 형태소 분석을 해서
"검색이","검색을","검색은" 따위를 그냥 "검색"으로 만들어 버리면
용량을 좀더 줄일수 있겠네요.
정확한? 검색은좀 손해보겠지만...
출처 : phpschool
'SQL' 카테고리의 다른 글
| [SQL 2K Books Online 5월 4일자 Update 다운로드] (0) | 2007/06/07 |
|---|---|
| 대용량 계층형 게시판 원리들 (0) | 2007/06/07 |
| 검색 방법 - 역인덱스 (0) | 2007/06/07 |
| MSSQL Server 2000의 오류처리 기법 (0) | 2007/06/07 |
| 문자열을 테이블 또는 배열로 저장하는 SQL 스크립트 (0) | 2007/06/07 |
| asp+오라클 정적쿼리 재컴파일 안하고 캐싱이용하기 (0) | 2007/06/07 |
0 Trackback,
0 Comment,
:




최근에 달린 댓글
링크
최근에 받은 트랙백
태그목록