통계적으로 불가능한 문구는 무엇입니까?
통계적으로 불가능한 문구 또는 SIP는 Amazon.com에서 개발 한 검색 기술로, 고유하거나 자주 발생할 가능성이있는 도서에 포함 된 문구를 검색합니다. 이것은 아마존의 특허받은 Search Inside! ® 기술 프로그램의 일부입니다. 기본적으로 Search Inside®는 Amazon이 도서의 일부 또는 전체 텍스트에 액세스 할 수 있도록하여 통계적으로 불가능한 문구가 검색에 사용되는 경우 특정 문구를 사용하여 해당 도서를 식별 할 수 있습니다.
이 기술의 이름은 약간 혼란 스럽습니다. 검색을 수행 할 때 검색하는 내용이 밀접하게 일치하기를 원합니다. 책에서 고유 한 문구를 식별하여 해당 문구를 사용하여 검색하면 원하지 않는 것을 검색 할 수 없습니다. 특정 책을 찾고 있는데 제목을 기억할 수 없지만 인용문을 기억할 수있는 경우, 인용 부호를 사용하여 책을 검색 할 수 있습니다.
또는 더 큰 주제 내에서 특정 주제를 검색 할 수 있습니다. 예를 들어, 직업 조언이있는 책을 검색하고 싶지만 실제로 읽고 싶은 것은 직업을 네트워크로 연결하는 방법으로 "경력 조언"대신 "네트워킹"을 검색 할 수 있습니다. 검색 결과 는 목격하기 전에 잘 파기 : 꼭 필요한 유일한 네트워킹 책과 같은 책을 포함하여 Amazon 검색 결과 페이지에 나타납니다.
이러한 유형의 통계적으로 불가능한 문구로 검색 한 경우 정확하게 일치하지 않는 결과를 얻을 수 있습니다. 예를 들어, 네트워킹의 첫 번째 검색 결과는 경력 네트워킹이 아니라 컴퓨터 및 기술 네트워크 정보입니다. 좀 더 구체적으로 지정하면 통계적으로 불가능한 문구를 더 잘 만들 수 있습니다. 예를 들어, 커리어 네트워킹 또는 작업 네트워킹에서 검색하여 더 나은 결과를 얻을 수 있습니다.
통계적으로 불가능한 문구는 실제로 검색 가능한 문구입니다. Search Inside! ® 책에 고유 한 문구 일 가능성이 높습니다. 예를 들어, 셰익스피어 소네트에서 셰익스피어 라인을 입력하여 셰익스피어에 관한 책을 가져올 수 있습니다. 잘 알려진 인용문은 다른 많은 책에서 제목으로 사용되기 때문에 항상 잘 작동하지는 않습니다. "To be or be be"를 검색하면 Hamlet을 찾을 수 없습니다. "Out!"과 같은 통계적으로 불가능한 문구가있는 Macbeth 도 찾지 않습니다. 사실,이 후자의 용어에서, 당신이 찾을 첫 번째 책은 얼룩 제거에 관한 책입니다.
통계적으로 불가능한 문구를 사용하는 것도 웹 컨텐츠를 검색하는 방법이며, 웹 크롤러는 유사한 기술을 사용하여 사람들이 특정 라인을 가장 효과적이고 구체적으로 검색 할 수 있습니다. 웹 크롤러가 반드시 콘텐츠를 평가할 필요는 없으므로 완벽한 기술은 아닙니다. 사람들이 키워드 반복 횟수가 더 많은 부분을 찾을 수 있도록 키워드 반복을 찾을 수 있습니다. 아마존의 모든 책에 Search Inside! ® 기술이있는 것은 아니지만 이것이 추세 인 것 같습니다. 시스템이 약간 불완전하더라도 검색 시간이 단축 될 수 있습니다.