0comments

연관분석 예제 in r

연결 규칙 마이닝은 집합의 다른 개체 간의 연결을 찾고 트랜잭션 데이터베이스, 관계형 데이터베이스 또는 기타 정보 저장소에서 빈번한 패턴을 찾으려는 경우에 사용됩니다. 협회 규칙 마이닝의 응용 프로그램은 소매, 클러스터링 및 분류에서 마케팅, 바구니 데이터 분석 (또는 시장 바구니 분석)에서 찾을 수 있습니다. 연결 규칙이라는 규칙 집합을 생성하여 고객이 자주 함께 구매하는 항목을 알 수 있습니다. 간단하게 말해서, 이 경우 양식의 규칙으로 출력을 제공합니다. 클라이언트는 이러한 규칙을 다양한 마케팅 전략에 사용할 수 있습니다: 사용자가 사용하는 제품 기능 또는 웹사이트 방문자가 방문하는 페이지를 수집하는 경우 기능 또는 웹 페이지 간에 `연결`을 찾을 수 있습니다. 이 기능은 특히 제품이나 웹 사이트를 디자인할 때 매우 유용하고 강력할 수 있습니다. 예를 들어, 연결 기반 통찰력을 바탕으로 대화에 “이러한 기능을 사용하는 사람들은 이러한 기능을 사용하는 경향이 있으므로 이러한 버튼은 서로 가까워야 합니다”와 같은 대화를 할 수 있습니다. 당신은 데이터 과학자 (또는 하나가되는!), 당신은 소매 점을 실행하는 클라이언트를 얻을. 클라이언트는 오랜 기간 동안 여러 고객이 스토어에서 구입한 항목으로 구성된 모든 트랜잭션에 대한 데이터를 제공하고 해당 데이터를 사용하여 비즈니스를 향상시킵니다. 클라이언트는 검색 결과를 사용하여 인벤토리의 항목을 변경/업데이트/추가할 뿐만 아니라 이를 사용하여 실제 저장소 또는 온라인 상점의 레이아웃을 변경합니다. 고객에게 도움이 되는 결과를 찾으려면 지정된 거래 데이터에 대한 연결 규칙 마이닝을 사용하는 MBA(시장 바구니 분석)를 사용합니다.

참고: 이 예제는 매우 작습니다. 실제로 규칙은 통계적으로 유의한 것으로 간주되기 전에 수백 개의 트랜잭션을 지원해야 하며 데이터 집합에는 종종 수천 또는 수백만 개의 트랜잭션이 포함됩니다. 연결 규칙 마이닝은 2단계 접근 방식으로 간주됩니다: 예를 들어, 규칙 {Bread}={Milk}, 리프트는 다음과 같이 계산됩니다: 위의 출력을 사용하여 다음과 같은 분석을 할 수 있습니다: 즉, Groceries.csv에서 7011 열을 얻었으며, 한편 포함된 예제(169 열)에서 Hi, 나는 프로젝트에서 일하고 있고 나는 당신의 코드를 매우 유용발견! 감사! 그러나 나는 질문이, 어떻게 내 자신의 데이터로이 분석을 수행해야합니까? .csv를 읽고 데이터 프레임으로 변환할 때 itemFrequencyPlot 명령이후 문제가 발생합니다… 이것은 간단히 말해서 연결 규칙입니다.

Comments are closed.