구조 마이닝이란 무엇입니까?
구조 마이닝은 반 구조화 된 데이터 소스를 스캔하고 구조의 요소를 발견하고 강조 표시하는 데이터 마이닝 유형입니다. 반 구조화 된 데이터 소스는 기존 테이블의 데이터베이스 구조를 사용하지 않지만 태그와 마커를 통해 정보를 분리하는 의미 요소를 갖는 소스입니다. 구조 마이닝은 데이터베이스, 웹 사이트 및 기타 여러 형태의 컴퓨터 정보를 마이닝하여 구조의 요소를 발견하는 데 사용될 수 있습니다. 사용자가 조각이 서로 상호 작용하는 방식이나 특정 태그에서 정보를 찾는 방법을 이해하는 데 도움이됩니다. 이 마이닝은 또한 사용자가 작성한 규칙에 따라 항목이 무엇인지 예측하는 데 사용될 수 있습니다.
다양한 유형의 데이터 마이닝이 있으며 대부분 기존의 구조화 된 소스 마이닝과 관련이 있습니다. 여기에는 대부분의 데이터베이스에서 일반적인 테이블과 노드를 사용하는 모든 소스가 포함됩니다. 구조 마이닝에서는 반 구조화 된 데이터 만 사용됩니다. 이 경우 데이터는 기존 데이터베이스 규칙을 따르지 않지만 구조는있는 웹 사이트 또는 간단한 데이터베이스에서 가져옵니다. 데이터를 올바르게 채굴하려면 각 항목을 구분하는 태그 또는 마커가 필요합니다.
반 구조화 된 데이터 세트를 읽음으로써 구조 마이닝은 구조의 상호 작용 방식을 발견 할 수 있습니다. 예를 들어, 각 웹 사이트에는 탐색 모델이 있으며이 모델이 페이지의 상호 작용 방식을 결정합니다. 구조를 마이닝하여 사용자는이 탐색의 작동 방식을 발견하여 유사한 탐색 스키마를 작성하는 데 도움을 줄 수 있습니다.
또한 구조 마이닝을 사용하여 마이닝 프로그램에 규칙을 작성하여 항목을 찾을 수 있습니다. 예를 들어 장부 데이터 세트가있는 경우 사용자는 색인이없는 책은 소설로 반환하고 색인이있는 책은 논픽션으로 반환해야한다는 규칙을 작성할 수 있습니다. 대부분의 소설 책에는 색인이 없으므로이 규칙은 데이터가 무엇인지를 정확하게 예측합니다. 이것은 조직적인 방법을 가지고 있지만 사용자가 찾고있는 것과 맞지 않는 반 구조화 된 세트를 볼 때 사용자를 지원합니다.
반 구조화 된 유닛의 구조를 알아 낸 후, 사용자는 일반적으로 다른 반 구조화 된 유닛과 비교할 것이다. 비즈니스 웹 사이트를 보유한 사용자는 탐색 및 링크를 위해 다른 비즈니스 웹 사이트를 마이닝하고 웹 사이트의 유사성을 확인할 수 있습니다. 채굴 된 정보를 비교함으로써, 사용자는 구조물의 효율을 증가시키는 방법을 찾을 수있다.