파이썬에서 Apriori 알고리즘을 구현하려면 다음 단계를 따르십시오: 이제 apriori 클래스의 매개 변수를 지정할 수 있습니다. 이 문서의 나머지 부분에서는 이 라이브러리를 사용하여 비교적 큰 온라인 소매 데이터 집합을 분석하고 흥미로운 구매 조합을 찾는 예제를 설명합니다. 이 문서가 끝나면 자신의 데이터 집합에 적용하는 기본 접근 방식에 충분히 익숙해져야 합니다. 지금, 까다로운 부분은이것이 우리에게 무엇을 알려주는지 알아내는 것입니다. 예를 들어, 트랜잭션 및 제품 조합 수를 감안할 때 예상보다 더 자주 발생하는 리프트 값이 높은 규칙이 꽤 많다는 것을 알 수 있습니다. 우리는 또한 자신감뿐만 아니라 높은 몇 가지를 볼 수 있습니다. 분석의 이 부분은 도메인 지식이 유용한 부분입니다. 나는 그것을 가지고 있지 않기 때문에, 나는 단지 몇 가지 예시 예제를 찾을 수 있습니다. Jupyter 노트북과 데이터 집합은 여기에 있습니다: https://github.com/pirandello/apriori apriori 알고리즘은 범주형 데이터에서 숨겨진 구조를 발견합니다. 고전적인 예는 슈퍼마켓에서 구매를 포함하는 데이터베이스입니다. 모든 구매에는 그와 관련된 여러 항목이 있습니다. 데이터에서 {빵, 계란} -> {베이컨}과 같은 연결 규칙을 발견하고자 합니다. 이것은 협회 규칙 학습의 목표이며 Apriori 알고리즘은 틀림없이이 문제에 대한 가장 유명한 알고리즘입니다.
이 저장소에는 1994년에 발표된 Agrawal 등의 원본 논문에서 비하한 apriori 알고리즘의 효율적이고 잘 테스트된 구현이 포함되어 있습니다. 다음은 처음 몇 개의 열이 개념을 설명하기 위해 열에 몇 가지 숫자를 추가한 내용입니다. 프로세스 속도를 높이기 위해 다음 단계를 수행해야 합니다. 결국, 우리는 시장 바구니 분석에 파이썬 프로그래밍 언어로 Apriori 모델을 구축했습니다. 세트는 | 집합 유니온을 사용하여 결합됩니다. 파이썬의 기호.


Nejnovější komentáře