Proposta TFS - MAC499
Recomendador de produtos para um comércio eletrônico
Aluno: Felipe Carvalho Perestrelo
Supervisora: Kelly Braghetto
Tema
Sistemas recomendadores para um comércio eletrônico
Resumo
Uma importante ferramenta utilizada por comércios eletrônicos para aumento da receita é o sistema recomendador de produtos. Este tipo de sistema gera as listas "quem comprou isso também gostou de", "recomendações personalizadas", e similares, presentes em praticamente todos os sites de varejo online atuais, independentemente de seu tamanho e faturamento.
Este tipo de sistema tem como objetivo sugerir itens relevantes ao usuário, estimulando o cross-sell (venda cruzada), e aumentando a receita do negócio. Existem diversas técnicas para determinar que item, ou conjunto de itens, sugerir. Um exemplo é o sistema avaliar o carrinho de compras do usuário e determinar, baseando-se no históricos de transações, qual item tem a maior probabilidade de ser comprado em conjunto com os itens atuais do carrinho. Outro exemplo comum, que é adequado ao caso em que não há informações suficientes, é sugerir a lista dos mais vendidos da categoria pertinente.
O estudo de um sistema de recomendação envolve diversas disciplinas da ci&etilde;ncia da computação, como aprendizado de máquinas, mineração de dados e interação homem-computador.
Objetivos do trabalho
Estudar técnicas de mineração de dados usadas em sistemas recomendadores e, a partir das técnicas estudadas, implementar um sistema recomendador clássico para uma base de dados fornecida por um comércio eletrônico real em contribuição para este trabalho. Além disso, considerando as particularidades dos dados do comércio eletrônico em questão, propor melhorias no sistema recomendador implementado que podem se referir, por exemplo, a adaptações em um técnica de mineração específica ou ao uso combinado de diferentes técnicas.
A base de dados utilizada para o trabalho contém registro de 197 transações e foi previamente descaracterizada preservando informações confidenciais como faturamento da loja e dados dos clientes.
Atividades já realizadas
- Estudo dos diferentes tipos de sistemas de recomendação e das técnicas de mineração de dados empregadas por eles.
- Obtenção das bases de dados que serão usadas no desenvolvimento do trabalho.
Cronograma de atividades
Junho - Julho
- Testes de diferentes técnicas de mineração e avaliação dos resultados.
- Definição do modelo de mineração de dados a ser aplicado no sistema recomendador.
Agosto - Setembro
- Desenvolvimento e aprimoramento de uma técnica de mineração de dados baseada nos estudos anteriores.
Outubro
- Desenvolvimento da monografia.
Estrutura esperada da monografia
Primeira parte
Introdução
- Introdução ao tema de mineração de dados e sistemas recomendadores.
- Motivação do trabalho.
- Desafios.
- Objetivos.
Conceitos e tecnologias estudadas
- Mineração de dados.
- Sistemas recomendadores.
- Técnicas avaliadas.
Atividades realizadas
- Levantamento da base de dados.
- Formulação dos testes das técnicas selecionadas.
- Planejamento da adaptação de uma nova técnica de mineração.
Resultados e produtos obtidos
- Extrato da base de dados.
- Resultados dos testes das técnicas avaliadas.
- Implementação da nova técnica de recomendação.
- Resultados dos testes da nova técnica de mineração com comparação com os anteriores.
Conclusões
- Qualidade da nova técnica desenvolvida.
Bibliografia
- RICCI, F.; ROKACH, L.; SHAPIRA, B.; KANTOR, P. B. Recommender System Handbook. Nova Iorque: Springer, 2011, 798 p.
- BAEZA-YATES, R.; RIBEIRO-NETO, B. Modern Information Retrieval: the concepts and technology behind search. Segunda Edição. Nova Iorque: ACM Press Harlow, 1999, 513 p.
- MANNING, C. D.; RAGHAVAN, P.; SCHUTZE, H. Introduction to Information Retrieval. Cambridge: Cambridge University Press, 2009, 482 p.
- DUDA, R. O.; HART, P. E.; STORK, D. G. Pattern Classification. Nova Iorque: Wiley, 2001, 654 p.
- ARAUJO, B. A; PEREIRA, S. E. Aplicação de Data Mining na área de CRM como ferramenta gerencial para tomada de decis&atide;o em empresas modernas . Revista UNIABEU, v.4, n.6, p. 144-160, jan./abr., 2011. Diponível em: http://www.uniabeu.edu.br/publica/index.php/RU/article/viewFile/116/174.
- CAMILO, C. O.; SILVA, J. C. D. Mineração de dados: Conceitos, Tarefas, Métodos e Ferramentas. Goiânia: Instituto de Informática da Universidade Federal de Goiá, 2009, 23 p. Relató Técnico: RT-INF_001-09. Disponível em: http://www.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_001-09.pdf. Data de acesso: Fev./2013.
- BAYARDO JR, R. J. Efficiently Mining Long Patterns from Databases. IBM Almaden Research Center. 92p. Disponível em: http://www.cs.tau.ac.il/~fiat/dmsem03/Efficiently%20mining%20long%20patterns%20from%20databases%20-%201998.pdf. Data de acesso: Mar./2013.
- RAGHU, A. A Fast Algorithm for Data Mining. San Jose: San Jose State University - Department of Computer Science. 47p. Disponível em: http://www.cs.sjsu.edu/faculty/pollett/masters/Semesters/Fall05/araghu/CS298Presentation.pdf. Data de acesso: Mar./2013.
- NORDMAN, A. Data Mining - Apriori Algorithm. Linkopings: Linkopings universitet - Department of Science and Technology. 47p. Disponível em: http://staffwww.itn.liu.se/~aidvi/courses/06/dm/lectures/lec7.pdf. Data de acesso: Mar./2013.
- KMINING. Business Intelligence, Knowledge discovery in databases (KDD) and Data mining: Definitions. Disponível em: http://www.kmining.com/info_definitions.html. Data de acesso: Fev/.2013.
- WIKIPEDIA. Data mining. Disponível em: http://en.wikipedia.org/wiki/Data_mining. Data de acesso: Fev./2013.
- WIKIPEDIA. Association rule learning. Disponível em: http://en.wikipedia.org/wiki/Association_rule_learning. Data de acesso: Fev./2013.
- WIKIPEDIA. Mineração de dados. Disponível em: http://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados. Data de acesso: Fev./2013.
- STATSOFT. What is Data Mining (Predictive Analytics, Big Data). Disponível em: http://www.statsoft.com/textbook/data-mining-techniques/. Data de acesso: Mar./2013.
- STATSOFT. A Short Course in Data Mining. Disponível em: http://www.statsoft.com/Portals/0/Products/Data-Mining/data_mining_tutorial.pdf. Data de acesso: Fev./2013.
Segunda parte
Desafios e frustrações encontrados.
Quais foram as disciplinas mais relevantes para o desenvolvimento do trabalho, e porquê.