39
学术出版,国际教著,国际期刊,SCI,SSCI,EI,SCOPUS,A&HCI等高端学术咨询
来源:职称驿站所属分类:新闻传播论文 发布时间:2018-07-21浏览:85次
信息的采纳与否和信息自身的特征密切相关,文章旨在探索如何通过信息自身的特征实现对信息采纳的预测以清博指数的微信健康类公众号榜单为依据,选取7个公众号实施信息采集,从信息的形式、内容和价值3个方面提取信息特征,根据编码规则形成样本数据集,并利用支持向量机进行预测研究。[结果/结论]通过信息自身的特征能够对信息采纳进行准确度较高的预测。
《新媒体研究》以马列主义、毛泽东思想、邓小平理论和“三个代表”重要思想为指导,全面贯彻党的教育方针和“双百方针”,理论联系实际,开展教育科学研究和学科基础理论研究,交流科技成果,促进学院教学、科研工作的发展,为教育改革和社会主义现代化建设做出贡献。
根据微信公众号“中国健康在线”2016年6月发布的最新中国人健康大数据[1]显示,中国人的健康问题已经到了不容乐观的境地,面对严峻的健康形势,国民对健康的关注度在不断提高,对健康信息的需求也在急剧增长。微信的出现和快速发展正在逐渐改变用户的信息获取渠道和方式[2],通过微信公众号传播健康信息的方式获得了健康养生类媒体、官方的公共医疗和卫生部门以及健康养生类企业[3]的一致青睐,相关类型的公众号数量也呈现急速增长的趋势[4]。然而面对同类型公众号间的激烈竞争,如何保持现有的用户粘性、吸引更多的潜在用户,是公众号都面临着的迫在眉睫的问题。
信息作为公众号的主要服务产品,用户对某一公众号的信息采纳程度越高,则其流向其他同类型公众号的可能性越小。因此,本研究从信息自身的特征出发,试图解答 3 个问题:①微信公众号上传播的健康信息具备哪些特征。②是否能够通过信息自身的特征来预测用户对信息的采纳情况。③对不同采纳衡量标准预测的准确度是否存在差异。
1 理论基础和研究方法
1.1 信息采纳
信息采纳(Information Adoption,IA)一词来源于技术采纳理论,随着技术采纳理论本文为江苏科技大学人文社会科学研究项目“高校图书馆社会化服务的若干关键问题研究” (项目编号: 2012QT085J) 和江苏科技大学人文社会科学研究(应用学科)项目“海研全球科研项目数据库萃智理论应用研究”(项目编号:2017QT018F)的成果。影响的不断扩大,该理论逐渐被应用于信息行为领域。最早的信息采纳模型是由 Sussman
和 Siegal[5]将精细加工可能性模型理论框架应用于在线信息传播与沟通情境而提出的,它将信息影响人们决策的过程看作是信息采纳过程,将信息质量和信息源分别作为影响信息采纳的中心路径和边缘路径,这一模型目前被广泛认可,也是本文的参考理论框架。
目前,国内外关于信息采纳的研究绝大多数集中在消费者信息采纳[6-9]方面,同时也有一些研究涉及旅游信息[10-12]、社区信息[13-15]和医疗信息[16-17]的采纳,而关于健康信息的采纳研究却不多见。同时,这些研究基本上都是先提出假设,而后建立模型进行分析和验证,却鲜有用支持向量机进行相关研究的。
1.2 支持向量机
支持向量机(Support Vector Machine,SVM)由 Vapnik[18]首先提出,是在统计学基础上发展而来的一种学习算法,其主要思想是构建一个超平面作为分类决策曲面,使得该超平面在保证分类精度的同时,能让不同类目之间的隔离边缘被最大化[19]。对于二分类问题,给定训练样本,输入特征向量 xi∈Rd(i=1,2,…,n)和对应的分类标签 yi∈{0,1}(i=1,2,…,n),其中 0 和 1 代表不同的分类,通过训练数据构建一个分类器,使得对未知样本的分类错误概率最低。
SVM 在模式分类问题上能有效克服样本分布、冗余特征以及过度拟合等因素的不利影响,具有全局最优性和很好的泛化能力,使得 SVM 得到了广泛的应用,在图情领域也不例外。相关研究涉及的范畴较为宽泛,既有关于博文[20]和文摘[21]分类的研究,也有如图灵奖得主的识别[22]、股市涨跌的预测[23]、微博客中的转发预测[24]等问题的研究。由于对信息采纳的预测实质上也是一个分类预测的问题,即对某一信息可能成为采纳类还是非采纳类的情况进行预测,SVM 能够为这一研究问题提供较好的支撑,因此本文采用比较常见的二分类 SVM 模型进行研究。
2 研究设计
2.1 概念界定
2.1.1 健康信息本文所提及的健康信息主要指与人们日常健康生活方式、健康行为密切相关的,以改善和提高个人身体健康水平为目的的各类信息。结合文献[25]中关于健康生活方式和健康行为的划分,以及 39 健康网、中国公众健康网和大众健康网站对健康的分类,将健康信息根据其所涉及的主题划分为 17 个子类:健康饮食、适量运动、健康睡眠、生活习惯、戒烟限酒、疫苗接种、合理用药、疾病预防、健康自测、母婴保健、减肥瘦身、口腔健康、两性健康、美容护肤、伤害预防、中医养生和其他日常健康知识。
2.1.2 微信公众号健康信息采纳在信息采纳的相关研究中,学者们将对信息的认同作为对信息采纳的一种测度[26-27],即认为如果用户对某一信息持肯定和赞同的态度,则可以认为用户在主观上采纳了该信息。对微信公众号上的信息而言,用户表达其信息态度最简单、直接的方式就是“点赞”。不少学者也对“点赞”的动机进行了研究,辛尔露[28]认为“点赞”功能属于一种新型的网络语言,在一定程度上具有约定俗成的含义,即:微信用户可以通过“点赞”表现自己对内容持肯定、赞扬和欣赏的态度,其他学者的一些相关研究也证实了这一观点[29-31]。虽然关于“点赞”动机的研究中显示社交动机也是点赞的主要动机之一,但是考虑到对微信公众号信息的“点赞”,其社交目的性相对较弱,因此可以认为对微信公众号信息的“点赞”更多的是出于对信息内容的肯定和认同,即愿意“采纳”的态度表达。
2.2 研究对象
本文以清博指数的微信健康类公众号榜单为基础筛选样本公众号,该榜单是按照 WCI 指数 [32] 进行排序的,该指数综合考虑了 “ 整体传播力 ”“ 篇均传播力 ”“ 头条传播本文为江苏科技大学人文社会科学研究项目“高校图书馆社会化服务的若干关键问题研究” (项目编号: 2012QT085J) 和江苏科技大学人文社会科学研究(应用学科)项目“海研全球科研项目数据库萃智理论应用研究”(项目编号:2017QT018F)的成果。力”“峰值传播力”4 个维度,以公众号信息的阅读数和点赞数为测算依据。榜单中排名靠前的公众号,其关注度相对较高,也能较好地反映用户的信息采纳状况。为综合考虑排名的变化,本文选择了在 2017 年 3—6 月间至少 3 次进入清博指数微信健康类月榜单前 10 的且进入 2017 年 7 月榜单(2017 年 7 月 1 日起 WCI 指数的计算方式进行了更新)前 10 的公众号,共 7 个,分别为丁香医生、新老人、健康养身、脉脉养生、健康头条、丁香妈妈和爱儿康。
2.3 研究步骤
2.3.1 数据采集与预处理数据采集的区间为 2017 年 8 月 1—31 日,采集的内容包括信息的标题、内容、阅读数和点赞数,其中阅读数和点赞数以消息发布后 7 天的数据为准[33]。此次共采集到 7 个公众号的 1187 条信息,剔除非健康信息和广告类、违规类以及后期主动删除失效的信息后,共得到 745 条有效信息。
2.3.2 信息特征集编码 结合 Sussman 和 Siegal 提出的信息采纳模型,主要从信息质量和信息源可信性两个方面提取信息特征。就信息质量而言,主要指的是用户感知的信息质量,单从信息自身的角度而言,能够影响用户感知信息质量的因素主要来源于 3 个方面:形式、内容和价值。就信息源可信性而言,主要以信息来源公众号的帐号主体是否通过官方认证为依据。
2.3.3 类别标签编码信息的采纳情况将作为每条样本信息的类别标签,为了明确信息特征值对不同采纳衡量标准的预测准确度,本文采用了两种采纳的衡量标准,一种是以所有样本信息的平均点赞数(Average Zan,AZ)为基数,高于该基数的信息视为采纳,反之则未采纳,这种标准衡量的是绝对采纳(L1);二是综合了阅读数和点赞数两个方面,以所有样本信息的平均点赞数与平均阅读数的比(Average Ratio,ARa)为基数,高于该基数的视为采
本文为江苏科技大学人文社会科学研究项目“高校图书馆社会化服务的若干关键问题研究” (项目编号: 2012QT085J) 和江苏科技大学人文社会科学研究(应用学科)项目“海研全球科研项目数据库萃智理论应用研究”(项目编号:2017QT018F)的成果。
2.3.4 生成样本数据集根据上述信息特征编码和标签编码,首先对 745 条样本信息逐条进行特征分析,并按照特征编码规则赋值,形成 745 个 1*8 维的特征向量 x(ii=1,2,…,745),然后按照标签编码规则分别为 745 个向量赋予标签,形成两个 745*1 维的标签向量 YAZ 和YARa。将向量矩阵 X=(x1,x2,…,x744,x745)T 分别与标签向量 YAZ 和 YARa 形成两个原始数据集 Z1=((x1,yAZ1),…,(x745,yAZ745))和 Z2=((x1,yAR1),…,(x745,yAR745))。
通过对两个原始数据集的观察,发现其中存在少量悖值,即具备相同属性特征值的标签值正好相反,为优化后续的模型训练与预测,对悖值的特征向量采取保留大概率标签、剔除小概率标签特征向量的方法,经处理后,Z1 数据集中共保留 704 条数据,Z2 数据集中共保留 697 条数据,这两个数据集将成为后续研究的样本数据集。
2.3.5 模型的训练与预测从两个样本数据集中分别选取 80%的数据作为训练集,余下的 20% 作为测试集。首先分别对训练集和测试集进行归一化处理,然后采用 SVM 参数优化的交叉验证思想为模型寻找最优的惩罚参数 c 和核函数参数 g 的最佳组合,进而利用 SVM 中不同的核函数进行模型的训练,比较训练所得模型的预测准确率,选择预测能力最佳的核函数,以该函数训练所得的模型对测试集进行预测,最后将预测得到的类别标签与测试集中的实际类别标签进行对比,进一步检验模型的预测效果。
3 结果与分析
3.1 采集数据描述
在标题句式方面,感叹句和疑问句占了绝大多数;在呈现方式上,“图片+文字”是使用最普遍的形式,其次是纯文字的形式,其他形式所占的比例都较少;在引证类型方面,没有引证的信息占了绝大多数,而在有引证的信息中,医学专家是最主要的引证源;在信息的原创性上,以非原创信息居多,通过对 7 个公众号数据的深入分析,发现新老人、健康养生和脉脉养生 3 个公众号的原创信息为零,因此拉低了整体原创信息的占比,而其他 4 个公众号信息中的原创性占比高达 70%;在内容类型方面,观点型的占比最大,而答疑型和建议型的比例基本持平;在健康主题方面,健康饮食类、母婴保健类和其他综合性的日常健康知识的占比较高,其余 14 个主题的占比均低于 6%;在认证情况方面,绝大多数的信息都来源于帐号主体已认证的公众号;在阅读水平方面,有超过半数的信息都拥有高于平均阅读水平的阅读数,说明大众对健康信息的关注度的确很高。
3.2 训练模型参数的选择结果
目前常用的 SVM 参数寻优的方法主要有 3 种:网格搜索寻优、遗传算法寻优和粒子群算法寻优,本文选用的是网格搜索寻优。其思想是先让参数 c 和 g 在一定范围内取值,然后利用交叉验证思想将原始数据集分为训练集和验证集,使得验证集的分类准确率达到最高的参数 c 和 g 的组合就是最佳参数组合。首先通过将参数 c 和 g 限定在一个较大的取值范围内进行参数的粗略选择。
4 结论
1)目前在微信公众号上传播的健康信息的主要特征是:倾向于采用强语气的标题句式,绝大多数是以图文并茂的形式进行展现,以医学专家的观点、建议等作为引证源的偏多,医学专业性较强的公众号主体发布的信息中原创比例较高,大多数信息倾向于以树立某些健康观念或反驳一些广泛流传的错误健康观念为主,信息涉及的健康主题偏重于日常的健康饮食方面,健康信息的大众关注度较高。
2)通过信息的形式特征、内容特征和价值特征,能够有效地实现对信息采纳的预测,且预测的准确率均达到了 85%以上。同时,对未被采纳信息正确预测的准确率要高于对采纳信息正确预测的准确率,笔者认为这可能是由于在实际信息采纳的过程中,主体的动机和偏好会对信息的采纳产生影响,如果能在今后的研究中加入这些影响因素,可能会使预测的准确率进一步提升。
3)通过信息特征对绝对采纳和相对采纳预测效果的比较,发现从信息的形式、内容和价值 3 个方面抽取的特征,对绝对采纳的预测能力要略高于对相对采纳的预测能力,不仅表
﹡本文为江苏科技大学人文社会科学研究项目“高校图书馆社会化服务的若干关键问题研究” (项目编号: 2012QT085J) 和江苏科技大学人文社会科学研究(应用学科)项目“海研全球科研项目数据库萃智理论应用研究”(项目编号:2017QT018F)的成果。
现在总体预测准确率上,而且在对采纳信息和未采纳信息正确预测的准确率上也有体现。
5 结束语
微信公众号上传播的健康信息拥有着多样的信息特征,它的采纳必将受到多重影响,无法简单地概括出具备哪些特征的信息更容易被采纳。但是本研究却为我们提供了一种可能,即在信息的各种特征属性都确定的情况下,就能够在一定程度上对它的采纳情况进行预测,这对公众号今后更好地提升信息服务水平具有重要的实践指导意义。
同时,本研究也为信息采纳提供了一个新的研究视角,所探讨的研究思路和方法,今后既可以尝试用于不同信息平台上的健康信息采纳研究,还可以进一步拓展到其他领域的信息采纳研究中,但考虑到信息类型的多样性和采纳衡量标准的差异性,需要在研究中根据实际情况进行相关要素的调整和完善,以保证研究方法的适应性和研究结果的科学性。□
参考文献
[1] 中国健康在线.中国人的健康大数据出来了,好惨,触目惊心![EB/OL].[2016-12-10].https://mp.weixin. qq.com/s?__biz=MzA4MzE2NDgzNQ==&mid=2649477644&idx=1&sn=a5fae41b5358e024eb6bd65242c4f d71&scene=24&srcid=0617mrhF5FK5Q6i9itTu76Lh&pass_ticket=S3IUQBjxAn3sNLJ6djFu/FTB3VfKiigp ABLKgU5oXPc1vbJGt7ROEn1KodaNFnrs#rd.
[2] 腾讯研究院.微信社会经济影响力研究报告(2016)[EB/OL].[2017-05-17].http://www.tisi.org/4861.
[3] 李东晓.微屏时代谁在传播健康?[J].现代传播,2016(4):21-26.
[4] 清博指数.微信总榜[EB/OL].[2017-02-10].http://www.gsdata.cn/.
[5] SUSSMAN SW,SIEGAL W S.Informational influence in organizations: an integrated approach to knowledge adoption[J].Information Systems Research,2003,14(1):47-65.
[6] ERKAN I,EVANS C.The influence of eWOM in social media on consumers' purchase intentions: an extended approach to information adoption[J].Computers in Human Behavior,2016,61:47-55.
[7] PENG L F,LIAO Q Y,WANG X R,et al.Factors affecting female user information adoption: an empirical investigation on fashion shopping guide websites[J].Electronic Commerce Research,2016,16(2):145-169
[8] 项典典.移动互联情境下消费者信息采纳行为的影响因素研究——基于多重中介效应的比较[D].昆明:云南财经大学,2016.
《微信公众号的健康信息采纳预测》
本文由职称驿站首发,您身边的高端学术顾问
文章名称: 微信公众号的健康信息采纳预测
下一篇:新闻故事化管理措施技巧
扫码关注公众号
微信扫码加好友
职称驿站 www.zhichengyz.com 版权所有 仿冒必究 冀ICP备16002873号-3