1 분 소요

네이버 지도에서 “방학역 삼겹살”을 검색했을 때 노출되는 주 가게 1개 + 경쟁 가게 7개의 정보를 수집하고, 각 가게의 리뷰 데이터를 기반으로 경쟁 분석 및 감성 분석을 수행하기 위한 기초 데이터를 구축했습니다.


1. 데이터 수집 개요

  • 수집 대상: 네이버 지도 검색 결과 상위 8개(주 가게 포함)
  • 데이터 수집 방법: Selenium 기반 크롤러를 이용한 자동화 수집
  • 수집 항목:
    • 가게 기본 정보
    • 메뉴 및 가격
    • 키워드 리뷰
    • 일반 리뷰(작성일, 방문 횟수 포함)

2. 수집 단계별 코드 및 설명

경쟁 가게 이름 추출

comparative_stores.py

  • 네이버 지도에서 “방학역 삼겹살”을 검색했을 때 노출되는 가게 이름 8개(중복 제거) 추출
  • 검색 결과 순서를 함께 기록하여 노출 순서 기반 비교 분석이 가능하도록 설계

기본 가게 정보 수집

basic_info.py

  • 각 가게의 이름, 방문자 리뷰 수, 블로그 리뷰 수, 주소를 수집
  • 주소 데이터를 활용해 위도/경도 좌표 변환
  • 추후 Tableau 지도 시각화에서 활용 가능하도록 구성

메뉴 정보 수집

menu.py

  • 각 가게의 전체 메뉴명과 가격 정보를 수집
  • 대표 메뉴 여부를 Boolean 형태로 표시 (True / False)
  • Tableau 시각화 시 대표 메뉴 강조 표시 기능 구현

키워드 리뷰 수집

keyword_reviews.py

  • 네이버 지도에서 제공하는 ‘키워드 리뷰’(예: ‘고기가 맛있어요’, ‘친절해요’ 등) 항목을 수집
  • 각 키워드가 선택된 횟수(선택 수)키워드명을 함께 저장
  • 단순 빈도 기반 키워드 비교 분석 가능

일반 리뷰 (텍스트 + 일자 + 방문횟수)

review_date_count.py

  • 각 리뷰의 본문 텍스트, 작성일(방문일), 방문 횟수(1회차, 2회차 등) 수집
  • 추후 감성 분석 및 방문 주기 분석에 활용
  • 해당 데이터는 이후 단계에서 텍스트 전처리 → TF-IDF → 감정 분석에 사용됨

다음 단계 (예정)

현재까지 데이터 수집 단계를 완료했습니다.
다음 단계에서는 수집된 리뷰 데이터를 기반으로 텍스트 마이닝을 진행할 예정입니다.

- 데이터 수집

네이버 리뷰 데이터를 크롤링하여 가게별 리뷰·메뉴·방문 정보를 수집합니다.

- TF-IDF 분석

리뷰 텍스트를 기반으로 가게별 특징 단어(차별 키워드) 를 추출하고 경쟁 가게 간 언어적 차이점을 분석합니다.

- 감성 분석 (Sentiment Analysis)

리뷰 내 긍정·부정 표현을 분석하여 가게별 감정 점수 및 비율을 산출하고
긍정/부정 키워드의 패턴을 비교합니다.

- Tableau 시각화

TF-IDF 및 감성 분석 결과를 기반으로
가게별 비교 대시보드 및 지역 기반 지도 시각화를 구현합니다.

- 인사이트 도출 및 협업

대시보드 인사이트를 바탕으로 마케팅 담당자와 협업하여
브랜드 강점과 개선 포인트를 도출하고 콘텐츠 방향성을 제시합니다.

- 마케팅 전략 기획 및 실행

도출된 인사이트를 홍보 콘텐츠, 이벤트, SNS 포스팅 등 마케팅 전략으로 연결합니다.


전체 크롤링는 GitHub Repository 에서 확인할 수 있습니다.