时间:2022-05-27 12:54:20
序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了七篇个性化推荐系统范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。
随着信息技术和互联网的迅速发展,人们逐渐从信息匮乏时代进入了信息过载时代。这个时代,对于信息生产者而言,如何让自己生产的信息脱颖而出,收到广大用户的关注是一件很困难的事情。对于用户而言,信息量的增大加重了找到感兴趣信息的负担,从而降低了信息的使用效率。推荐系统正是在这一环境中诞生的,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐系统。
1 推荐系统概念、组成要素
目前被广泛接受的推荐系统的概念和定义是Resnick和Varian在1997年给出的:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。个性化推荐系统主要由三个要素组成,分别是:候选对象、用户、推荐算法。推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。
2 推荐技术
推荐算法是整个推荐系统中核心的部分,在很大程度上决定了推荐系统的质量。目前主要的推荐技术基本包括以下几种:基于关联规则的推荐技术,基于内容的推荐技术,协同过滤推荐技术和混合推荐技术。
2.1 基于关联规则的推荐技术
关联规则是数据中所蕴含的一类重要规律,对关联规则进行挖掘是数据挖掘中的一项根本任务,关联规则挖掘就是从数据项目中找出所有的并发关系,这种关系也称为关联。关联规则挖掘的经典应用就是购物篮数据分析,目的是找出顾客在商场(或普通店铺)所选购商品之间的关联。
关联规则可以这样表述。设I={i1,i2,…,in}为所有项的集合,事务T表示事务集合。数据库D为事务数据库。关联规则形如XY的蕴含式,其中X、Y均为项目集,并且X、Y没有交集。关联规则的强度可以用支持度和置信度表示。支持度为同时包含X、Y 项集的事务在数据库D中的百分比。置信度为包含X的事务同时也包含Y在数据库D中的百分比。目前已有大量文献提出关联规则挖掘算法,在众多算法中,最著名的是Apriori 算法。
Apriori算法是由Agrawal等人在1994年提出来的,是一种最有影响的挖掘布尔关联规则频繁项集的算法。该算法分两步进行:第一步,生成所有繁琐项目集,繁琐项目集是支持度高于最小支持度的项目集;第二步,从繁琐项目集中生成所有可信的关联规则,可信关联规则是置信度大于最小置信度的规则。
基于关联规则的推荐技术其优点是:简单直接,领域通用性强,规则的挖掘可以离线进行,可以保证推荐算法的实时性要求。其缺点是:存在着严重的"冷启动"问题,新加入的项目由于缺少相关的用户数据,难以被系统中的规则发现,从而得不到推荐,并且随着系统项目数量的不断增加,规则也会呈出相应的增长趋势,使得规则的管理成本相应升高,降低了系统的运行效率。
2.2 基于内容的推荐技术
基于内容的推荐算法重要的是建立项目特征属性库,系统通过用户已关注项目的特征属性值,来掌握目标用户兴趣点,依据用户兴趣点与待推荐项目属性值的匹配程度进行推荐。用户兴趣点的产生依赖于系统所采用的机器学习算法,如基于向量的表示、文本挖掘、判别树、神经网络等技术。基于内容的推荐结果直观易理解,不需要过多的领域知识,但是需要有足够数据构造分类器,一些例如稀疏问题、新用户问题和复杂属性等问题不易处理。
2.3 协同过滤推荐技术
基于协同过滤推荐技术是当前主流的,应用最为广泛的一种推荐技术。该推荐技术可以分为两种,一种是基于用户的协同过滤推荐技术;另一种是基于项目的协同过滤推荐技术,这两种协同过滤推荐技术的不同之处在于两者针对的对象不同。基于用户的协同过滤推荐技术是给用户推荐和他有共同兴趣的用户喜欢的物品;基于项目的协同过滤推荐技术是给用户推荐和他之前喜欢的物品相似的物品。
2.3.1 基于用户的协同过滤推荐技术
基于用户的协同过滤技术是推荐系统中最古老的算法。该算法在1992年被提出,并应用于邮件过滤系统,1994年被GroupLens应用于新闻过滤。该算法主要包括两个步骤:第一步,找到和目标用户兴趣相似的用户集合;第二步,找到这个集合中用户喜欢的,且目标用户还没有听说过的物品,将该物品推荐给目标用户。
2.3.2 基于项目的协同过滤推荐技术
基于项目的协同过滤技术是基于这样一个假设:用户更倾向于选择与用户喜欢的项目相近的项目。该推荐过程分为两个步骤,第一,计算物品之间的相似度;第二,根据物品的相似度和用户的历史行为为用户生成推荐列表。
2.4 混合推荐技术
目前,推荐技术已经发展出了很多种,但每种推荐技术都在不同程度上存在各自的缺点,每种推荐技术在针对特定的用户或者项目时才能发挥出自己的优势。因此人们提出了混合推荐来互补推荐技术各自的不足,已达到一个理想的推荐效果。在大部分的混合推荐技术研究当中,是将基于内容的推荐技术和基于协同过滤技术相结合。相对于使用单一途径算法的推荐技术,基于混合推荐技术往往表现出更高的推荐精度和更好的推荐质量。
3 推荐系统的应用
自推荐系统诞生近20年的时间里,推荐系统的应用领域迅速扩展。从电子商务、音乐视频网站,到作为互联网经济支柱的在线广告和新颖的在线应用推荐,到处都有推荐系统的身影。下面简单介绍个性化推荐系统的应用以及该领域较成功的网站。
3.1 电子商务
电子商务网站是个性化推荐系统的一大应用领域。著名的电子商务网站亚马逊是个性化推荐系统的积极应用者和推广者,被读写网称为“推荐系统之王”。亚马逊的推荐系统深入到了各类产品中,其中最主要的应用有个性化商品推荐列表和相关商品的推荐列表。
3.2 电影和视频网站
在电影和视频网站中,个性化推荐系统能够帮助用户在大量视频信息中找到令他们满意的视频。该领域较成功的一家公司就是Netflix。Netflix在2006年开始举办著名的Netflix Prize推荐系统比赛。该比赛对推荐系统的发展起到了重要的推动作用。
3.3 个性化音乐网络电台
个性化推荐的成功应用需要具备两个条件。第一是存在信息过载的问题,第二是用户大部分时候没有明确的需求。在这两个条件下,个性化网络电台无疑是最合适的个性化推荐产品。目前国际上著名的有Pandora和Last.fm,国内的代表则是豆瓣电台。
3.4 个性化阅读
阅读文章是很多互联网用户每天都会做的事情。目前互联网上的个性化阅读工具很多,国际知名的有Google Reader,国内有鲜果网等。同时,随着移动设备的流行,移动设备上针对个性化阅读的应用也很多,其中具有代表性的有Zite和Flipboard。
[参考文献]
[1]Resnick P.Varian HR Recommender systems[外文期刊].1997(03).
[2]许海玲.互联网推荐系统比较研究[J].软件学报,2009.20(2):350.362.
[3]王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012,48(7).
[4]刘兴涛,石冰,解英文.挖掘关联规则中Apriori算法的一种改进[J]. 山东大学学报,2008,43(11):67-71.
[5]胡斌.基于高阶潜在语义分析的音乐推荐系统的研究,硕士论文.北京工业大学计算机学院,2009.
[6]Schafer JB,Konstan J,Riedl J.Recommender systems in e-commerce[M].On Electronic Commerce,1999.P367-461.
[7]Deshpande M,Karypis G.Item-based top-N recommendation algorithms[J].ACM TransInformation Systems,22(1):143-177,2004.
智能Web时代的到来意味着大数据分析在各个行业的运用成为必然趋势,推荐系统作为典型的智能Web应用,通过对用户行为数据的积累和分析,将传统用户的搜索行为转化为推送行为,从而实现原始电商到智能电商的转变。本文以智能Web时代为引,就旅游电商推荐系统的基本实现方法和思路展开了讨论和分析。
【关键词】智能Web 个性化旅游电商
1 智能Web时代的到来
当我们去订餐的时候,饭店订餐系统引用了我们公开的健康调查数据,从而为我们搭配适宜的绿色饮食;当我们与陌生人在线聊天时,对话内容得到通讯软件后台的事实核查,保证交流内容的真实和安全(如facebook);当我们在线购书时,电商平台能够根据用户购物行为的相似度判断来给出最合理的推荐(如亚马逊)。这一系列的发生与正在发生的案例为我们诠释了一个时代的到来,智能Web时代。
所谓智能,是指能够不断通过大数据分析抽象出普遍规则,进而替代穷举的一种高效机器学习方式。拓展开讲,一款智能Web应用要首先具备大数据能力,或者叫内容聚合,这是机器学习的基础条件;然后需要具备参考结构,参考结构为原始大数据提供了科学的解释和展示形式,它为原始数据的分析和展现提供了重要的助力;最后还要具备合理的算法,算法为从数据转变为信息提供了可行的方法,并将信息抽象为引导用户交互的规则,这三大要素构成了智能Web应用的充要条件。
2 旅游电商推荐系统研究与设计
作为一类典型的智能Web应用,推荐系统因为谷歌的广告和亚马逊的商品推荐等形式为人们所熟知,它的出现为当下信息过载的大环境带来了良好的解决方案。通过对用户行为数据的积累和分析,将传统用户的搜索行为转化为推送行为,从而实现原始电商到智能电商的转变。
旅游电商对推荐系统的认识度和重视度目前还处于比较初级的状态,远不如消费品电商平台,这也反映出了旅游电商企业对大数据的分析处理意识与主流消费品电商的差距。我们认为,实现高效用的旅游电商推荐系统,需要在精准度和展现形式两方面进行深入研究,第一是要对旅游产品进行精确建模,只有精确建模才能在推荐计算中获得准确的结果。第二是推荐引擎的科学选择,常见的推荐系统引擎分为两类,协同过滤推荐和基于内容分析的推荐。协同过滤推荐是基于用户的行为数据积累做出推荐,例如基于相似用户的推荐和基于相似条目的推荐。基于内容分析的推荐则需要考量用户之间、条目之间和用户与条目内容之间的相似度。其中,相似度算法是不同推荐引擎的核心,我们通过如下常用代码片段来说明相似度的计算方法。
由代码1可知,事实上相似度计算的方法是多样化的,需要根据实际的问题进行相似度算法的选择,目前大量的实验表明,基于欧氏距离的相似度算法效果相对较好。
在大数据的精确分析基础上,再将推荐结果以服务而非广告的展示形式推送到旅游电商的各个营销环节,必将会极大的推动产品购买的转化率。
3 旅游电商推荐系统展望
在智能Web时代,随着人们对信息和服务的智能化要求,推荐系统必定会在旅游电商营销环节占据愈加重要的地位,同时,单一的旅游产品推荐将会无法满足用户的需求,旅游推荐系统的衍生形态将会慢慢发展起来,推荐系统的内容和展示方式也都将会呈现出多元化和个性化的趋势。作为旅游电商的从业者,必须清楚的认识到推荐系统、大数据分析、智能Web等要素对旅游电商发展的推动作用,并随势而动,才能在互联网+的时代获得市场和用户的青睐。
参考文献
[1]吴婷,熊前兴,贺曦春.基于用户特征和用户兴趣变化的协同过滤推荐[J].电脑知识与技术,2008,4(7).
[2]王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012,48(7).
[3]张娜.电子商务环境下的个性化信息推荐服务及应用研究[D].合肥工业大学,2007.
[4]许海玲.互联网推荐系统比较研究[J].软件学报,2009,20(2).
[5]王巧荣,赵海燕,曹健.个性化服务中的用户建模技术[J].小型微型计算机系统,2011,32(1).
作者简介
严杰(1981-),男,浙江省衢州市人。硕士学位。现为浙江旅游职业学院讲师。研究方向为Web开发和电子商务。
【关键词】特征提取技术个性化网页推荐系统应用
个性化网页推荐系统,对现代电子商务的发展具有重要的实用价值和商业价值。将特征提取技术广泛的应用在个性化网页推荐系统中,对于操作系统应用网络系统和数据挖掘技术对客户进行商品推荐,实现了销售再次合作,有效的防止了客户的流响。
一、个性化网页推荐系统
近年来,随着网络在世界范围内的普及应用,民众对网页的浏览已在世界范围内风靡。个性化网页推荐改变了用户单一被动接受信息的模式,搜索引擎功能的运用实施也比以往的只有搜索与用户匹配的关键词完成上,占有更大优势。个性化网页推荐的应用,扩大了网页推荐引擎的搜索范围,能为用户提供更多他们感兴趣的网页。个性化网页中,关键词的概括更具概括性。
个性化网页推荐体系的服务器端,由特征提取对其负责文本进行分类预处理,通过对候选网页进行推荐和进一步筛选,最后再与客户端实现数据的交互传输。
二、特征提取技术
特征提取技术,即可以通过提取用户阅读的网页内容,挖掘出用户感兴趣的内容。在个性化网页推荐系统中的应用,通过关联规则筛选出了符合条件的搜索内容,避免了搜索过程中出现的无法搜索项。推荐网页链接由网页推荐系统对用户程序自动捕获阅读网页事件,并通过客户端在浏览器窗口右侧。以当前网页为中心,将兴趣分支供用户观赏。
特征提取技术应用在网页推荐系统中,能使Web通过网络用户注册数据的了解用户基本情况,偏好及浏览行为中累积的原始空间维数,对于用户潜在的兴趣爱好及未来商家的可实用性和可操作性进行综合评判。
由于网页推荐系统显示的终端数据五花八门,从原理上来说,就承载了太多数据的无效空间,利用“指纹”特征,能更有效,更有针对性的挖掘出有用的信息,而且节省了时间和用户就此付出的费用。网页推荐系统研究中,就将特征提取技术作为通信领域的划时代变革。
由于网页数据的无结构化特点,在对一些文本进行预处理时,原始空间特征你的系统维数,无论怎样来说都需要特征压缩文件对其维数进行压缩工作.网页的特征提取技术,在这一时段的应用中就发挥了不可超越的力量。
三、个性化网页推荐系统设计与应用
因为个性化网页推荐系统是多步骤系统性处理数据,对于提高其系统的实时性和处理空间维数的能效来说,可以费时较长的步骤利用系统服务器的闲置时间进行处理或将部分结果存储于数据库中。
特征提取技术在个性化网页推荐系统中的设计使用原理:商家经由Web处理和识别用户;通过特征提取技术,读取系统数据库数据并经由用户反过来信息以后,再次将数据库数据传输给用户;再次由系统自动组件,通过用户反馈回来的信息挖掘并推荐处理再次数据;对于数据结果,网页系统会对原始空间维数进行预处理,将部分耗时较长的数据自动在系统闲时处理,部分用于存入LOG中;个性化网页推荐系统就以存储读取数据,最后对网页做出推荐结果。中间的各个环节,都需要用户意见的及时反馈,最终处理的结果就是个性化网页推荐系统将高效正确的信息显示给用户。这样就完成了,特征提取技术在个性化网页推荐中的运用。
个性化网页推荐系统中,广泛应用特征提取技术,不但有利于降低空间系统维数,更有利于对用户所需要的信息进行价值凭升,对于原始空间中存在的无价值信息,特征提取会做出及时的反馈并根据自身评定,做出简单取舍。
特征提取技术的进步,能有效提升计算量,在中文标识记的文本特性中,提取的精确度,直接程度上有利于个性网页推荐使用中,达到用户的满意度,提升他的内在营运价值,将网页浏览和获取信息量,真正成为商业用途中高效能的使用工具。
四、总结
特征提取技术在个性化网页推荐系统中的应用,对于网络交易平台的实现和节省用户使用网络的费用和时间,同时对于促进网络商务交流合作具有极大的创新意义。利用网页推荐技术助企业分析从网上获取有效数据,实现他们的动态科技创新发展,具有很大意味的企业调整营销策略。
参考文献
[1]于洪波.网页特征提取技术研究[J].山东理工大学学报(自然科学版). 2011,3
[关键词] 电子商务 体育营销 个性化推荐系统
近年来,电子商务的快速发展极大地改变了传统的贸易模式,为企业和消费者提供了一个相互交流的便捷平台。本文旨在提出一个适合于体育营销的个性化推荐模式,以期使电子商务能广泛、高效地为发展体育事业服务。
一、国内电子商务个性化推荐系统的现状
目前个性化推荐已开始在国内电子商务领域初现端倪,PC零售业的巨头――Dell公司正是通过提供个性化推荐在电子商务活动中获得了巨大的成功。然而,在电子商务推荐系统的应用方面,国内电子商务网站与国外网站相比差距还较大,主要表现在:
1.缺乏个性化的推荐: 由于很多推荐笼统地粗放地面向所有用户,而非个性化的推荐,其结果与每一用户的特殊兴趣并不相符合,这是我国电子商务推荐系统最主要的缺陷。
2.推荐的自动化程度低: 大多数的推荐功能都需要用户经过一段时间与计算机进行交互,输入自己感兴趣的信息,然后才能得到结果。并且,系统不能保存用户每次输入的信息。总体来说,所有的推荐策略都基本上停留在查找这一层次上,不能实现自动推荐。
3.推荐的持久性程度低: 目前大多数的推荐策略都是建立在当前用户会话的基础上,不能利用用户以前的会话信息,因而推荐的持久性程度非常低。这也是国内推荐系统的不足之处。
4.推荐策略单一: 大多数推荐系统所用的推荐策略基本上就是分类浏览和基于内容的检索,缺乏多种推荐策略的结合使用,尤其缺少个性化与非个性化推荐策略的混合使用。
产生以上问题的主要原因,首先是消费者对电子商务不信任的社会心理还比较普遍,不愿提供真实的个人信息。其次,是现实生活中电子商务个性化推荐不到位,管理制度不完善,无法达到消费者要求的水平,建立提供电子商务个性化推荐的网络系统的技术也欠发达。
二、电子商务个性化推荐系统及其分类
电子商务个性化推荐系统(Personalized Recommendation Systems for E -Commerce)的正式定义由Resnick & Varian在1997年给出:“电子商务个性化推荐系统是利用电子商务网站向用户提品信息和相关建议,帮助用户决定购买什么产品,通过模拟销售人员帮助用户完成购物过程的系统”。这个定义现在已被广泛引用,推荐系统的使用者是用户(电子商务活动中的用户)(user),推荐的对象是项目(item)。项目是推荐系统提供给用户的产品或推荐,也即最终的推荐内容。
根据推荐对象的特点,目前存在的推荐系统可以大致分为两类:一类是以网页为主要推荐对象的推荐系统,它主要采用Web数据挖掘,尤其是使用Web日志挖掘的方法来分析用户的兴趣,向用户推荐符合其兴趣爱好的网页链接。另一类推荐系统的推荐对象主要是产品,这种系统主要在电子商务网络购物环境中使用,帮助用户找出他真正想要的产品。
三、电子商务个性化推荐系统模块
1.输入模块(Input):主要负责对用户信息的收集和更新。输入来源按时间划分,可分为用户当前行为输入和用户访问过程中的历史行为输入;也可以分为个人输入和群体输入两部分。输入形式主要包括:用户注册信息输入、隐式浏览输入、关键字输入、编辑推荐输入、用户购买历史输入等等。
2.推荐方法模块(Recommendation method)是整个推荐系统的核心部分,它直接决定着推荐系统的性能优劣。推荐方法模块是以推荐技术和推荐算法为技术支撑。
3.输出模块(Output)负责将推荐结果输出给用户。输出形式主要包括相关产品输出、个体评分输出、相关推荐输出等。
四、电子商务个性化推荐系统的体系结构
与传统的网站系统相比,个性化的电子商务系统有一个很大不同之处:个性化的电子商务网站一般都没有静态页面,这是由HTTP协议的“无状态性”所决定的。浏览器与Web推荐器之间的一个交互过程如图1所示。
从上图可见,客户机浏览器与Web推荐器之间采用TCP连接,并且该连接状态在此次连接过程中尚能保持。但是,Web推荐器在发送给客户机应答信息后,便“遗忘”了此次交互,无论Web推荐器和客户端浏览器都不会记忆上一次连接的状态。目前,解决这个问题的方法一般有两种:
1.使用Cookie。Cookie是存储在Web客户端机器上的一个小文本文件。Web推荐器端的处理程序可以创建一个Cookie,然后让推荐器把该信息发送给客户端的浏览器。浏览器收到信息后即把数据存储在客户端的硬盘上。以后,当该客户再次访问该站点时,推荐器的处理程序向客户机的浏览器请求该Cookie。 通过Cookie,可以使推荐器端的处理程序具有交互性。
2.采用全动态的页面。“全动态”是指在获取用户的身份信息后,在用户访问的每一个页面中都写入系统分配给顾客的一个唯一标识,当用户向推荐器提交推荐请求时,这个标识也一起传送到了推荐器。这样,推荐器端的处理程序可以从这个标识中获取用户的身份信息。采用这种方式,不同的用户拥有不同的标识,不同的顾客也就有了一套不同的页面。这些页面只可能通过处理程序来动态生成。
因此,一个个性化的电子商务系统一般是没有静态页面的。综上所述,一个个性化电子商务网站的基本结构如图2所示。
五、个性化处理单元的设计
1.个性化处理部分:这是个性化处理单元中一个很重要的部分,它与接口部分协作,完成了个性化网页的生成工作。个性化处理部分一个大致的工作流程如下:(1)确认用户身份,以便对不同的用户提供不同的推荐。如果由于输入错误或其他一些原因,用户可能无法通过身份认证,对此系统可以有不同的处理方式。(2)获取用户配置信息。用户在通过认证后,系统将从后台数据库中获得用户配置信息,如用户的兴趣、爱好等等。根据系统的不同,需要的用户配置信息也会有所不同。(3)生成动态页面。匹配中心根据用户的配置信息,与相应的数据库进行交互,动态生成页面。 最后通过连接管理模块将结果页面发送给Web推荐器,最终由推荐器将页面返回给发送请求的用户。
2.管理部分;其工作是在后台管理整个系统的运行,对于一个个性化系统来说,管理部分还有一些特殊的地方:(1)管理工作的内容比较繁杂。管理工作有的是直接为访问网站的用户推荐的,有的是为网站后台应用服务的。(2)进行管理工作的人员也比较复杂。在一个个性化的系统中,高级决策人员、销售人员、网页维护人员等都可以进行相应的管理工作。正因为如此,管理部分成为个性化系统中一个不可缺少的部分。管理部分共有内容管理模块、规则管理模块、后台管理模块三大块,每个模块的功能都不相同。
3.接口部分:这一部分包括接入管理模块和数据库接口两部分。个性化处理单元处于Web推荐器与后台数据库之间,它通过接口部分与Web推荐器和数据库连接。因此,接口部分在 Web推荐器、个性化处理单元和数据库间起到了一个“桥梁”的作用。(1)接入管理模块。接入管理模块的主要功能是接收Web推荐器发送的请求信息,并将产生的结果页面返回Web推荐器。根据Web推荐器中HTP网关的不同,接入管理模块可以是一个外部的应用程序,或者是一个连接入推荐器的模块。(2)数据库接口。数据库的接口大致可以分为两类:通用接口和专用接口。通用接口,如ODBC, JDBC等,可以连接到多种数据库。专用接口只能对应于某种专用的数据库。但通用接口在速度方面不如专用接口。根据网站规模的不同、经营项目的不同、硬件设备的不同,库接口都会有所不同,这需要具体问题具体分析。
六、结束语
电子商务网站为终端客户和分销商等商业个体提供商业信息交流的平台,如何对系统留下的大量冗余的商业数据再利用是一个具有挑战性的问题。随着数据挖掘技术的成熟,尤其是Web挖掘技术的产生,如何提供电子商务网站个性化推荐越来越受企业关注,也是保障企业生存发展的重要因素之一。
参考文献:
[1]余力:电子商务个性化――理论、方法与应用.清华大学出版社,(2006)
【关键词】网络数据挖掘;个性化电子商务;推荐系统
【中图分类号】C37【文献标识码】A【文章编号】1672-5158(2013)07-0109-01
引言
在信息化全方位发展的今天,电子商务之所以能在世界范围内迅速发展,其优势在于方便、快捷、成本低、受限少。然而,电子商务也同样存在一些必须解决的问题,就是用户和商家之间的互选问题,即用户对所需产品的挑选和商家对用户所需的了解。通过网络数据挖掘与电子商务的恰当结合,就可以很好的解决这一问题,对电子商务的发展起到了很大的帮助。
1 网络数据挖掘
1.1 网络概述
在社会生活中存在着关乎人们工作和生活的各种各样的系统,通过对其本质进行分析,可以得到一个抽象的包含众多节点和连接节点的边的网络。网络是复杂系统的研究工具,为复杂系统的研究提供了新的模式和思想方法。
1.2 网络数据挖掘推荐算法
1.2.1 基于二部分图网络结构的推荐算法
因为系统的主体都是用节点来表示的,但是网络中的节点可以是一个类型,也可以不是一个类型。节点的连接关系用矩阵表示,这类节点属于单模式网络;节点不是一种的类型,不同类型的节点之间才能连接的网络称为二部分网络。
运用二部分图结构的算法,把推荐的系统中项目节点看作是具备一定的,能够分配出去的资源,同时可以把资源分配给其他看好的商品项目。
1.2.2 基于用户关联网络的推荐算法
之所以可以将网络思想引入推荐算法,是因为电子商务系统中的用户与商品及用户与用于之间具有关联性,这种基于网络的商务系统具有非常强大的适应性。主要思想就是:首先,建立用户选择的商品与评价信息之间的关联图,以权值计量。然后,在已形成的关联图中,按某商品的全部使用记录,把该商品推荐给其它相关权值较大的用户。
2 个性化电子商务推荐系统
2.1 个性化电子商务推荐系统的内容
电子商务是指有商务能力的实体,通过现代的电子技术来进行商务活动的过程。特别是现阶段,电子商务所表现出的优势越来越明显。现有的个性化推荐系统在主动为用户提供所需的信息或服务的基础上,更能同时满足为企业谋利益的要求,能为企业大力发展潜在用户,也就是可以通过个性化推荐系统实现双向推荐。
2.2 推荐系统的主要研究内容
2.2.1 信息的获取以及模型建立
随着因特网在全球的迅速发展,在准确获取用户信息的基础上,包括用户浏览行为等内容在内的交互式用户信息获取方式成为发展的趋势,这就要求在获取用户信息时,要对信息提前进行分类。
模型建立和更新的数据来源于不同途径得到的用户信息数据,并与其数量和质量密切相关,通过数据清理和转换筛选出适用于建模的数据。现阶段常见的建模技术有:关联规则挖掘、基于内容的过滤、聚类算法等。
2.2.2 推荐算法设计的有关研究
推荐算法有实时、准确、高效的特点,现在使用的主要算法都具有不同的适用领域,由于电子商务系统的使用率日渐增多,用户数据库的内容也越来越多,因此必须要在保证算法准确性的基础上,同时对其实时性进一步研究。尽管新的设计正在不断被推出,但都有一定的片面性,所以,想要得到较理想的推荐算法还需要进一步的研究。
2.2.3 评价推荐系统存在的问题
由于推荐系统的应用领域较多,并且不同的推荐系统的评价目的各异,另外,现在的评价指标大多只注重评价系统的单一特征,想对目前的推荐系统进行客观的评价还是比较困难的。现在常用的六种准确度评价指标有:预测准确度、排序准确度、半衰期效用指标、距离标准化指标、预测打分关联、分类准确度。
2.2.4 一些应用方面的问题
研究推荐系统的目的就是使其能够在不同的领域中取得应用,虽然推荐系统已经取得很好的应用效果,但其发展空间还是非常巨大的,如发展企业需要的潜力用户、拓宽推荐系统应用领域等。
3 数据挖掘与个性化推荐系统
电子商务系统中的信息量非常巨大,并且保持与日俱增的趋势,数据挖掘技术可以让这些蕴含着非常有用的规则和模式的数据得到很好的运用,从而更好的提供个性化服务。
3.1 聚类分析技术
聚类就是把数据在无指导的情况下通过非预先设定方式进行分组划分,这些数据之所以具有潜在性是因为它们都是在划分过程中自动生成的。利用这种技术得到的数据更有关注意义,更适合于分析使用。在个性化推荐系统中,通过聚类技术将客户按照不同的特征划分成不同的部分,这就使得搜索工作的效率大大提高。
3.2 关联规则技术
关联规则就是在数量庞大的数据中找出项集中的有用规则,以其高效的性能和伸缩性而成为是一个很热门的数据挖掘技术。但关联规则也有它的不足之处,就是参数阈值设置时会影响规模的效率。
关联规则中有两个很重要的概念,即置信度和支持度。以商品销售为例,关联规则生成步骤如下:第一步,从所有销售产品中找到全部的繁项集,这也是关联规则挖掘的核心和热点所在。第二步,生成关联规则,在频繁项目集中找到同时符合最小置信度和最小支持度的关联规则。
3.3 协同过滤技术
协同过滤是现阶段使用频率最多、效果最好、最受欢迎的一项技术。该技术主要是针对用户,通过搜索目标用户得到用户的行为偏好同时做出商品评价。通常所说的协同过滤技术主要指基于用户的协同过滤技术,随着对该技术的不断研究和发展,基于商品项目的协同过滤技术也得到了不断的提高。
3.3.1 基于用户的协同过滤技术
该技术的研究对象主要是用户,并且在现实生活中的使用率较高。即通过假设,把对某一商品具有相似评价的用户列为相似用户,并由此推断归结到一起的相似用户对其他商品也会有相似的评价。
基于用户的协同过滤算法实施步骤:(1)获取用户信息,即利用用户—项目矩阵描述用户所获得的商品的信息,这是用户信息获取步骤中最主要的内容;(2)相似性的计算以及相似用户集的产生,就是通过相似性计算得到与目标用户相似的用户群,得到符合相似用户数的一定数量的相似用户;(3)生成推荐结果,是在相似用户集的基础上,根据推荐方法生成推荐结果。
3.3.2 基于项目的协同过滤技术
基于项目的协同过滤技术的研究对象主要是商品项目。该技术就是用相似性计算,得到用户评价的商品项目与目标项目的相似值。利用它们之间的共性,预测用户对目标项目的评价值,通过这样的方式来获得同类商品信息。
结束语
电子商务推荐系统的应用领域非常之广,特别是将网络数据挖掘技术与其相结合,更好的符合了电子商务领域的用户所需。本文系统地阐述了网络数据挖掘和个性化商务系统以及他们之间的结合,探讨了网络技术在个性化商务系统中的应用。在今后的工作过程中,还应加强对基于网络数据挖掘的个性化电子商务推荐系统的深入研究,以切实提升系统运行的安全性与可靠性。
参考文献
[1] 张远程,康永胜.基于swarm平台和社交网络的电子商务个性化推荐系统仿真模型的理论构建[J].计算机光盘软件与应用,2012,(21):124-125
关键词:数据挖掘;关联规则;聚类;个性化推荐;图书馆
中图分类号:TP391文献标识码:A文章编号:1009-3044(2009)31-pppp-0c
The Application Research of Association Rules and Affairs Grouping Technique in Library Individualized Recommendation System
ZHANG Ting1, YAO Wan-hui2
(1.International Business School, Anhui University, Hefei 230011, China; 2.Education Department, Hefei University, Hefei 230601, China)
Abstract: This paper puts forward the correlation algorithm which is based on affairs grouping technique by the analysis of classical Apriori algorithm’s mining process .Readers are clustered by profession, grade, borrowing amount and other characteristics. Then, correlation analysis is made on each group. The bookrecommendation quality of this algorithm is better than the classical Apriori algorithm.
Key words: data mining, Association rules, Clustering, individualized recommendation, Library
上世纪80年代以前图书借阅主要依赖卡片进行人工检索、登记。随着信息技术和网络技术的发展,80年代图书馆迎来革命性的技术――图书馆自动化信息管理技术。该技术以计算机和自动化集成管理系统为平台辅助图书馆工作人员处理采购、编目、流通、检索等业务。90年代后期,以数据挖掘技术为基础的数字图书馆技术得到了较快发展,数字图书馆管理系统能够主动分析读者、图书及流通历史记录,找出其中隐藏的关系和规律,根据不同的读者特点提供相应的服务。个性化推荐系统是其中的一个重要分支,它将已借图书列表作为形式参数,规则作为函数,得到推荐图书列表。
推荐算法是个性化推荐系统中的核心部分,它在很大程度上决定了推荐系统性能。目前,主要的推荐算法包括:协同过滤推荐、基于内容推荐、基于关联规则推荐等。本文探讨基于关联规则推荐(Association Rule-based Recommendation)算法及应用。
1 关联规则挖掘算法介绍
1.1 基本概念
设I={I1,I2,……,Im}是项的集合;设与任务相关的数据D={T1,T2,……,Tn}是数据库事务的集合,其中每个事务T是项的集合,使得T?哿I,每个事务T有一个事务标识符TID;设A是一个项集,A?哿T。关联规则是形如A=>B的蕴涵式,其中A?奂I, B?奂I,并且A∩B=?I。有如下定义:
1) 包含A和B(即包含A∪B)的事务在事务数据库D中的百分比称为规则A=>B在D中的支持度,support(A=>B)=P(A∪B)。
2) 事务数据库D中包含A的事务同时也包含B的百分比称为规则A=>B在D中的置信度,confidence(A=>B)=P(B|A)。
3) 如果项集A的相对支持度计数满足预定义的最小支持度阈值(min_support),则A是频繁项集(Frequent Itemsets)。
4) 数据库事务集D在I上满足最小支持度和最小置信度(min_confidence)的关联规则称为强关联规则。
关联规则挖掘过程由两步构成:
1) 找出所有的频繁项集:通过用户给定的最小支持度,寻找所有频繁项集,即满足支持度不小于min_support的所有项目子集。
2) 由频繁项集产生强关联规则:通过用户给定的最小置信度,检查每个频繁项集。在其中找到置信度不小于min_confidence的关联规则,将这些规则输出。
1.2 经典Apriori算法
经典Apriori算法是R.Agrawal和R.Srikant于1994年提出的为布尔关联规则挖掘频繁项集的原创性算法。
Apriori使用逐层搜索的迭代方法,即k项集用于发现(k+1)项集。首先,通过扫描事务数据库,累计每个项的计数,搜集满足最小支持度的项,找出频繁1项集的集合,该集合记作L1。然后,L1用于找频繁2项集的集合L2,L2用于找L3,如此下去,直到不能在找到频繁k项集Lk。每个Li的生成都需要一次事务数据库完全扫描。
2 基于聚类的事务集分组技术
2.1 算法性能分析
Apriori算法在具体应用领域内存在很多的问题,其中最为典型的是事务数据不均衡。在图书个性化推荐系统中,试图寻找图书之间的关联规则,即寻找满足最小支持度的图书频繁项集,再由频繁项集和最小置信度生成关联规则。而生成频繁项集所依赖的图书借阅事务数据库D中的借阅事务是不均衡的,有如下表现:
1) 专业图书一般被本专业内读者借阅,而非专业图书(如:文艺、小说等)为所有专业的读者共享。专业图书的借阅记录相对整个借阅记录的比例很低,导致专业图书的支持度偏低,而大量的非专业图书的支持度却很高。在实验中表现为置信度很高的规则因不满足最小支持度阈值而丢失,专业图书推荐质量下降。
2) 各专业的人数差异很大,在统一的最小支持度阈值情况下,即使min_sup的值很小,对人数少的专业,规则生成数量仍然很少,推荐系统对此类专业不公正。
在上述的背景下,试图通过降低最小支持度阈值的方法解决问题是不科学的。虽然降低最小支持度阈值会增加规则数量,减少有价值规则的丢失,但是,这会导致运算量的大幅度攀升,而且专业图书推荐质量并不能够得到明显的提高。
[关键词]电子商务个性化信息服务个性化推荐系统
一、个性化信息服务
随着网络技术的不断发展和电子商务的盛行,个性化信息服务成为了各商家在激烈的竞争中立于不败之地的重要法宝。DELL公司的成功,就证实了个性化信息服务的重要性。个性化信息服务是指互联网络使用者可以按照自己的目的和需求,在某种特定的网络功能和服务方式中,自己设定网上信息的来源方式、表现形式、特定网上功能以及其他的网上服务方式等,以达到最为快捷地获取自己所需的网上信息服务内容的目的,强调“以用户为中心”尽可能的满足用户的需求。个性化信息服务应用于电子商务中,通过捕获用户的兴趣来提高商品的销售量。
二、个性化信息服务的主要特点
1.以用户为中心,以满足用户个性化的价值追求为目标。个性化信息服务应主动为用户选择最需要的资源与服务,根据用户需求的变化,动态的改变所提供的信息,让用户得到个性化的服务。它以满足特定用户的特定需求为主旨,以给用户提供最快捷、最方便、最易用的服务为目标,它是“以用户为中心”的服务,可以是以用户的信息需求为依据,面向用户开展的一切服务性活动,也可以是针对特定需求向用户提供特定信息的有计划、有目的的活动,服务的基础就是用户的信息需求。
2.具备智能化信息分析与处理功能。个性化信息服务中的智能化信息分析与处理功能一方面表现在系统的主动性推荐和协同推荐上,另一方面表现在对用户综合行为的挖掘中。主动推荐是指主动采集并跟踪用户浏览的信息,从用户日常检索浏览中主动学习用户的兴趣,推理并预测用户需求,及时处理推荐信息;协同推荐是指根据不同用户的相同点或相似性进行信息推荐,使需求相同的用户之间共享查询结果。用户综合行为的挖掘是针对用户所有可能被记录下来的行为进行数据挖掘,实现资源的深层挖掘并提供有效的服务。
3.推荐精确、系统的知识。个性化信息服务通过过滤、屏蔽无关无用的冗余信息,推荐精确、有效、真正具有针对性的信息,:能自动地、智能地将大量的数据转换为具有规律性、系统性的知识,形成具有内在关联的信息链和知识链,并以易于理解的模式推荐给用户。
4.主动性、高效性、灵活性。个性化信息服务采用“push”技术,其主动性主要是指服务不需要用户及时请求而主动地将数据传给用户,与传统的浏览器的“pull”技术的被动服务形成鲜明的对比;高效性主要是指可在网络空闲时启动,能够有效的利用网络带宽,比较适合传送大量的多媒体信息;灵活性主要体现在用户能够完全根据自己的方便和需要,灵活地设置连接时间,通过E-mail、对话框、音频、视频等方式获取网上特定信息资源。
5.允许用户充分表达个性化需求。个性化信息服务系统不仅提供友好的界面,而且方便用户交互、描述自己的需求、反馈对服务结果的评价等。
三、个性化信息服务研究的基本问题
个性化信息服务研究的基本问题包括个性化的具体应用:个性化应用分为资源的个性化入口和过滤/排序;用户信息需求定义文件的表示与创建:用户信息需求或兴趣的描述和存储;协同过滤与单独过滤:针对一个或一组用户对信息文档根据文件进行的相关度排序;系统的体系结构:用户信息需求定义文件放在服务器还是客户计算机上,或者处于二者之间的服务器上;个性化系统的评估:包括信息需求定义文件的收敛分析和信息需求定义文件是否反映用户的实际兴趣分析。这些问题也是设计一个具体的应用必须要明确的问题,而且它们之间是互相关联、互相制约的。
四、个性化信息推荐系统
推荐系统是一种在特定类型数据库中进行知识发现的应用技术,使用多种数据分析技术为用户更好的服务,向用户主动、及时、准确地提供所需信息,并能根据用户对推荐内容的反馈进一步改进推荐结果。不仅要对用户提出的要求提供最贴切的信息服务,还要能依据个体个性特征,主动收集个体可能感兴趣的信息,甚至预测个体可能的个性发展,提前收集相应的信息,最后以个性化方式显示给个体。是实现个性化信息服务的关键。
1.个性化信息推荐系统的关键技术。个性化信息服务推荐系统是实现个性化信息服务的主要途径,主要是通过信息过滤和协同过滤等技术将用户需要的信息推荐给用户的。其关键技术有:
(1)内容过滤技术:试图跟踪和把握用户的潜在信息需求,比较资源和用户描述文件,对动态信息流进行过滤,尽量屏蔽无用信息,向用户主动提供信息资源列表,从而提高用户获取信息的效率。
(2)协同过滤技术:利用用户的访问信息,通过用户群的相似性进行内容推荐,不依赖于内容仅依赖于用户之间的相互推荐,避免了内容过滤的不足,保证信息推荐的质量。
(3)聚类分析技术:对数据对象进行分类,把一组数据对象分到不同簇中,簇是一组数据对象的集合,使簇内各对象间具有较高的相似度,而不同组的对象差别较大。
2.个性化信息推荐系统的基本要求。个性化信息服务是为用户打造量身订制的服务,是为了更好的满足用户的需求。个性化信息服务推荐系统应该满足个性化、主动性、新颖性、准确性的基本要求。
(1)个性化:根据不同用户的不同背景、不同需求,为不同用户提供不同的信息,存在一定程度的个性差异。
(2)主动性:系统主动根据用户的信息需求向用户提供信息,实现“信息找人”的过程,而不是“人找信息”。
(3)新颖性:系统向用户提供的信息是用户以往所不具有的,未曾访问的却又是需要的。
(4)准确性:在相同或相近的信息资源中,对两个不同用户的相似要求返回不同的信息结果,以满足不同用户的不同需求。
3.个性化信息推荐系统体系结构。目前,个性化信息推荐系统总的来说可以分为基于规则的和基于过滤的两种推荐系统。基于关联规则的个性化信息服务,主要针对特定的站点组织结构,采用最大向前访问路径辅助内容事务方法。制定一系列规则并利用这些规则为特定用户提供服务。利用规则来推荐信息依赖于规则的质量和数量,基于规则的技术缺点是随着规则的数量增多,系统将变得越来难以管理。基于过滤的个性化推荐服务分为基于内容过滤的推荐服务和基于协同过滤的推荐服务。基于内容过滤是通过比较资源和用户信息描述文件,推荐与用户兴趣相似的资源。基于协同过滤的推荐系统则是利用用户群的访问信息,通过用户群之间的相似性进行内容推荐。
结合以上两类系统,为了能够为用户主动提供所需信息,个性化信息服务推荐系统一般需要通过用户接口模块、需求信息模块、信息检索模块、用户分析模块、信息过滤模块、信息推送模块6个功能模块来实现。
(1)用户接口模块:是用户与系统之间的接口。负责处理用户初次输入的用户信息,并将它存储在用户信息库中;接收用户输入的认证信息,与用户信息库中的个人认证信息比较,完成用户身份认证;处理用户的检索需求;将用户输入的兴趣、爱好信息及用户对于推荐信息的评价提交给需求分析模块,接收信息推送模块送来的信息,最终将其提交给用户。
(2)需求分析模块:是对用户接口模块送来的用户初始兴趣信息进行分析,建立用户模型,并根据用户反馈修改用户模型。
(3)信息检索模块:是接收用户接口模块处理过的用户检索需求,检索本地数据库和网络数据库,并将检索结果送到信息过滤模块,并将其存储到本地信息库中。
(4)用户分析模块:是负责比较该用户模型与其它用户模型之间的相似度,找出有相同或相似兴趣的其他用户,相互推荐信息,实现信息资源共享。
(5)信息过滤模块:是根据用户模型对信息检索模块返回的检索结果进行过滤并将过滤的结果送到信息推荐模块;此外,如果用户分析模块找到了具有相同或相似兴趣的用户,信息过滤模块也将这些用户的个性化信息传送到信息推荐模块。
(6)信息推荐模块:是负责实现主动信息服务,根据用户信息库中对于信息推送的时间、数量等设置,将经过信息过滤模块过滤的信息推送到用户接口模块。
五、结束语
传统的定题服务所具有的主动性是有限的,从根本上讲仍是“用户找信息”,而个性化信息服务是依托网络环境的,可以在较高程度上改变信息与用户的关系,能够满足网络环境下真正实现“信息找用户”。个性化信息服务以其交互性好、不受时间地域的限制、针对性强、资源丰富等优点,将成为电子商务发展的方向。
参考文献:
[1]曾春:信息过滤的概念表示与算法研究[D].北京:清华大学,2003