iWiz ShareBase

IT Specialist 윤태현의 iWiz ShareBase는 IT뿐 아니라 각종 잡다한 지식들을 함께 나누는 지식공유 커뮤니티입니다.

iWiz,ShareBase,윤태현,Java,JSP,EJB,IT,정보기술,웹프로그래밍,PHP,ASP,DBMS,MySQL,서버,네트워크,server,network,WAS,웹애플리케이션,블로그,blog,웹서버,DB,오라클,oracle,mysql,JRun,웹로직,톰캣,tomcat,아파치,자동차,EF쏘나타,로또 6/45

갤러리 Pixelgrapher.com | 로또 6/45 번호생성 및 통계 데이터 | 전체기사보기 | 전체글 #1 | 전체글 #2 | 전체글 #3 | 전체글 #4 | 전체글 #5 | 전체글 #6 | 전체글 #7 | 전체글 #8 | 전체글 #9 | 전체글 #10 |
HOME iWiz
ShareBase
Remember 0523 & 0818
지식은 나눌수록 커집니다 - iWiz's ShareBase
IT 잡동사니 기타 IT 및 컴퓨터 기술 관련 잡동사니 자료들을 모아두었습니다.


  iWiz(2004-03-13 12:28:50, Hit : 8051, Vote : 12
 http://www.wz.pe.kr

나란히 진열된 기저귀와 맥주, 비밀은「데이터마이닝」


최근 몇년사이 지역마다 대형할인점이 크게 늘어나고 있다. 월마트, 까르푸 등 외국계 할인점을 비롯해 홈플러스, 이마트 등 국내 굴지의 대기업까지 대형할인점 사업에 뛰어들었다.

경쟁이 심해지다 보니 최저가격 보상제도, 마일리지 등 파격적인 가격정책이 연이어 발표되고, 매장 배치와 상품 진열에도 세심하게 공을 들이고 있다.

대형할인점은 지난 여름 도심의 심야 풍속도를 보여주는 대표적인 아이콘이기도 했다. 야심한 시각, 열대야를 피해 삼삼오오 손을 잡고 대형할인점을 찾은 가족과 연인들의 모습은 언론의 스포트라이트를 받았다.

여기서 돌발퀴즈 하나. 이와 같은 대형할인점에서 유아용 기저귀와 함께 가장 잘 팔리는 제품은 무엇일까. 흔히 기저귀가 있는 코너의 다른 제품들, 예를 들면 티슈 제품이나 치솔, 아이들 장난감 등을 떠올리겠지만 정답은 ‘맥주’다. 미국의 대형쇼핑몰 월마트가 조사한 결과에 따르면, 아내의 부탁으로 기저귀를 사러 온 남편들이 맥주를 함께 구입하기 때문인 것으로 나타났다. 당연히 월마트는 기저귀와 맥주를 매장에 나란히 배치했고, 맥주 매출을 크게 올릴 수 있었다.

이러한 월마트의 성공 뒤에는 ‘데이터마이닝(Datamining)’이란 개념이 숨어 있다. 데이터마이닝이란 기업이 보유한 대용량 데이터들 사이에서 상호 연관성과 패턴 등을 찾아내는 방법론으로, 월마트의 경우 고객들의 매출 내역이라는 엄청난 양의 데이터(Data)에서 ‘기저귀와 맥주의 관계’라는 귀중한 정보를 캐내는데(Mining) 데이터마이닝을 활용했다.

데이터마이닝, 방대한 정보 더미에서 금광 채굴
데이터마이닝을 활용한 사례는 수없이 많다. 영국의 한 보험회사는 ‘창문이 많은 집에는 도둑도 많다’는 사실을 자사의 보험상품에 적용해, 주택의 창문개수에 따라 차별화된 보험요율을 적용함으로써 수익율을 높일 수 있었다.

고급 테니스 라켓을 구입한 사람이 곧이어 골프채를 구입할 확률이 높다는 사실, 요일별 잘 팔리는 상품들 간의 연관성을 조사해 진열대에 변화를 주는 것 등도 모두 데이터마이닝을 활용한 사례들이다.

데이터마이닝은 지난 1960년대 초 미국 통계학자 제임스 마이어와 에드워드 포지가 처음 고안한 것으로 알려져 있다.

당시 두 사람은 은행에서 새로운 대출 고객들의 신용도를 산출하는데 데이터마이닝 개념을 도입해, 나이, 수입, 전화 보유 여부 등을 따져 신용도를 파악했다. 이후 1980년대 중반 미국 통신회사 AT&T가 컴퓨터를 이용한 고객분석 기법을 개발하면서 현대적인 의미의 데이터마이닝이 확립됐다.

데이터마이닝 기법에는 크게 연관성 탐사, 연속성 탐사, 분류규칙 탐사, 군집 구분 등 네 가지가 꼽힌다. 먼저 연관성은 동시에 발생하는 사건 그룹내에서 이들 사이에 존재하는 친화성 혹은 패턴을 알아내는 것으로, 콘칩을 구매하는 소비자의 50%가 콜라도 함께 구입한다는 IBM의 ‘시장바구니 분석’이 대표적이다. 연속성은 사건들의 시간적인 관계를 규명하는 기법으로, 앞서 언급한 고급 테니스 라켓을 구입한 후, 머지않은 장래에 골프채를 구입할 확률이 높다는 조사 결과 등을 꼽을 수 있다.

분류규칙 탐사와 군집구분은 모두 데이터 그룹의 특성을 찾아내는 방법이지만 개념은 조금 다르다. 분류규칙 탐사가 특정 항목에 속하는 그룹을 미리 정해 놓고 그 특징을 발견해 나가는 것이라면, 군집 구분은 사전에 어떤 그룹도 정의하지 않는 것이 특징이다.

도난 카드 매출도 잡아낸다
금융계의 신용도 조사를 위해 탄생한 데이터마이닝은, 현재 고객관리와 마케팅 등에 다양하게 활용되고 있다. 특히 광고나 영업 분야에 있어서는 활동 방식을 근본적으로 바꿔 놓았다고 해도 과언이 아니다. 기존의 불특정 다수를 대상으로 더 많이 노출되도록 다양한 매체에 물량공세를 했다면 현재는 데이터마이닝을 통해 집중해야 할 매체와 방법을 더 좁히거나 심지어 1대 1 맞춤 광고도 가능해 졌다.

대표적인 경우가 인터넷 서점들이다. 아마존닷컴의 경우 특정 책을 구입한 사람이, 어떤 책을 구입했는지, 어떤 책에 관심을 보였는지 수많은 연결고리들을 끊임없이 만들어 놓는다. 책을 구입하기 위해 사이트를 방문한 사용자가 과거에 읽었던 책 혹은 관심을 갖고 있었던 책에 대한 정보를 웹페이지 한켠에서 볼 수 있는 것은 모두 데이터마이닝 덕분이다. 현재 이러한 서비스는 국내 대부분의 인터넷 서점에서 시행중이다.

카드사의 신용카드 도둑잡기도 데이터마이닝의 대표 사례로 꼽히고 있다. 수많은 매출 데이터를 표본으로 조사한 결과, 도난 카드의 경우 연속적으로 6~7번 사용하며 거래간 시간 차이는 30분 정도, 사용액수도 적당한 액수를 유지한다는 사실을 발견했다. 현재 국내 주요 카드사들은 이러한 시스템을 지난 1997년부터 도입해, 비정상적인 매출에 대해서는 지급을 유예하거나 가맹점에 실시간으로 확인하는 시스템을 갖추고 있다.

이밖에도 로그인한 사용자가 주부인지 직장인인지, 직장인이라면 어떤 직종에 종사하는지에 따라 배너 광고의 종류가 바뀌는 웹사이트라거나 해당 사이트내 방문 기록을 근거로 발송되는 맞춤 메일 등 데이터마이닝은 고객관계관리(CRM)의 가장 중요한 방법론으로 널리 활용되고 있다. 최근에는 지리정보 시스템과 연동해 영업점 10km내에 살고 있는 고객을 찾는 식의 G-CRM이나, 인간 DNA의 비밀을 푸는 게놈 프로젝트, 지하자원 탐색에까지 영역을 넓히고 있다.

정보의 가치판단은 사람의 몫···전문인력이 중요
그러나 국내 데이터마이닝 수준이 아직은 초기단계에 머무르고 있다. 기반 IT 장비가 잘 보급된 점이나 고객 관리에 중점을 두는 마케팅이 확산되고 있다는 것은 데이터마이닝이 일반화될 좋은 호재로 해석되지만, 전문 인력이 부족하고 데이터마이닝의 기반이 되는 신뢰할 만한 기초 데이터가 충분치 않다는 점은 걸림돌로 꼽히고 있다.

특히 인력 문제는 데이터마이닝에 있어 가장 중요한 요소다. 데이터마이닝은 그 속성상 기업 운영과 밀접한 관계를 갖고 있기 때문에 일정정도 내부사정에 대해 잘 알고 있어야 하고, 설사 시스템에 의해 마이닝된 결과가 나온다고 해도 그 가치를 판단하는 것은 결국 사람의 몫이기 때문이다.

앞서 언급한 ‘기저귀와 맥주’ 사례에서도 이를 어떤 데이터를 기반으로 조사할 것인지, 마이닝된 결과에 따라 실제 매장 배치를 변경했을 때의 효과를 판단해 시행하는 것은 결국 사람의 역할이다. 전문가들은 어떤 데이터를 원하는지 명확히 알고 이를 데이터 더미 속에서 찾아낼 수 있는 인력을 양성하는 것이 무엇보다 필요하다고 지적한다.

디지털 빅브라더의 그림자?
데이터마이닝은 IT 인프라의 발전상을 나타내는 상징이기도 하다. 과거 정보인프라가 부실했던 시기에는 독점된 정보에 어떻게 접근할 것인가에 초점이 맞춰졌다면, 데이터마이닝은 정보의 과잉이라 할만큼 공개된 정보가 너무 많아 이 정보들 간의 상관관계를 통해 유용한 정보를 추출하는 데로 관심이 이동했음을 보여주기 때문이다.

그러나 대부분의 IT 기술이 그렇듯, 데이터마이닝 역시 논란의 여지를 남겨두고 있다. 데이터마이닝을 통한 1대 1 맞춤 고객관리는 기업측에서 보면 무척이나 달콤한 유혹이고, 고객들도 때때로 그 도움을 받고 있지만 여기에는 필연적으로 사생활 침해라는 치명적인 아킬레스건이 존재한다.

특히 인터넷의 경우 이러한 데이터마이닝을 위한 기초 자료 수집 과정이 필연적으로 개인정보를 필요로 하기 때문에 더욱 논란이 된다. 사용자의 동의없이 각종 개인정보와 사이트 방문 기록 등을 빼가는 스파이웨어의 경우 애드어웨어와 같이 전문적으로 이를 탐지해 제거하는 프로그램이 등장할 만큼 심각한 수준이다.

기저귀를 사면서 바로 옆에 진열된 맥주를 발견하는 것은 분명 ‘편리한’ 일이지만, 이를 위해 언제 어느 할인점에서 무엇을 했는지 공개되는 것을 감수하겠다는 사람은 흔치않을 것이다. 그것은 인터넷을 항해하다 보면 가끔 만나는 섬뜩한 시선, 즉 디지털 빅브라더의 시선과 크게 다르지 않기 때문이다. @

박상훈 기자 (ZDNet Korea) 2003/11/24

愛水太半 (2004-03-16 10:21:20)  
학교 다닐적에 들었던 마케팅기법 수업에 나왔던 성공사례 중의 하나네요. 쩝~
iWiz (2004-03-17 01:20:07)  
이런것이 바로 DB의 위력이라 할 수 있겠죠... 예전부터 술자리에서 열변을 토해왔지만 모 DBA의 주장처럼 시스템이 중요한게 아니죠.


119   USB 메모리 4종 크기 비교  iWiz 2012/03/07 7428 0
118   LG070 기본 AP(myLG070) 사용/사용안함 설정  iWiz 2010/02/22 12844 0
117   스마트폰 시대 ‘모바일 OS 전쟁’  iWiz 2010/02/10 11237 0
116   애플-플래시-HTML5를 둘러싼 ‘갑론을박’ 관전법  iWiz 2010/02/03 9425 0
115   무선랜, 전자렌지·무선전화기 옆에선 '거북이'  윤태현 2008/07/02 7230 0
114   Windows XP 4G RAM 사용하기  iWiz 2008/02/05 11790 0
113   인텔 Core2Duo 성능비교 벤치마크  iWiz 2008/02/04 8723 0
112   멀티 그래픽 카드 솔루션, 진화 혹은 퇴보?  iWiz 2006/06/14 6542 0
111   "MS 오리가미" UMPC의 모든것  iWiz 2006/03/10 5451 2
110   Intel CPU 제품군 일람표  iWiz 2006/03/01 5269 2
109   KT 공유기 색출 시스템은 엄포?…개발자들 ″검출 불가능″  iWiz 2005/08/28 5533 3
108   애플, IBM과 결별 인텔과 손잡는다  iWiz 2005/06/06 4516 1
107   MSN 메신저의 로그인 메일주소 삭제하기  iWiz 2005/03/16 6002 1
106   한눈에 살펴보는 DVD 레코딩의 원리와 작동 방식  iWiz 2005/02/15 7861 6
105   씨디롬의 문(트레이)이 잘 열리지 않을 때  iWiz 2004/12/24 6267 17

1 [2][3][4][5][6][7][8]
 

Copyright 1999-2023 Zeroboard / skin by zero
iWiz ShareBase, ⓒCopyleft by iWiz.  For more information contact .
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나 그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며, 이를 위반시에는 정보통신망법에 의해 형사처벌됨을 유념하시기 바랍니다. [게시일 2004. 1. 31]