基于知识图谱的新闻推荐系统研究
摘 要
随着信息技术的快速发展,新闻推荐系统已经成为帮助用户筛选和推送新闻内容的重要工具。然而,传统的推荐系统往往依赖于基于内容的推荐方法,无法有效捕捉新闻内容之间的深层次语义关系。为了克服这一问题,基于知识图谱的新闻推荐系统应运而生。本文基于Django框架,设计并实现了一个基于知识图谱的新闻推荐系统,该系统通过构建新闻的知识图谱,利用图谱中各实体间的关系,实现对新闻内容的精准推荐。
在系统设计中,首先对新闻内容提取其中的实体信息,并通过知识图谱将这些实体之间的关系进行建模。然后,通过分析用户的历史行为和兴趣偏好,结合知识图谱中的语义信息,生成个性化的新闻推荐。Django框架被选用作为系统的开发平台,它提供了灵活的Web开发环境,支持高效的数据交互和用户管理功能,使得系统具有良好的可扩展性和易维护性。
实验结果表明,基于知识图谱的新闻推荐系统相较于传统的推荐方法,能够更准确地捕捉新闻内容之间的关系,提升推荐的准确性和用户满意度。此外,系统的响应速度和稳定性也得到了有效保障,能够满足大规模用户访问的需求。
本文的研究为新闻推荐系统的进一步发展提供了新的思路和方法,尤其在利用知识图谱进行语义理解和个性化推荐方面,具有较强的创新性和应用价值。
关键词:知识图谱;新闻推荐系统;Django框架;个性化推荐
Abstract
With the rapid development of information technology, news recommendation systems have become an important tool to help users filter and push news content. However, traditional recommendation systems often rely on content-based recommendation methods and cannot effectively capture the deep semantic relationships between news content. To overcome this problem, news recommendation systems based on knowledge graphs have emerged. This article is based on the Django framework and designs and implements a knowledge graph based news recommendation system. The system constructs a knowledge graph of news and utilizes the relationships between entities in the graph to achieve accurate recommendation of news content.
In system design, first extract entity information from news content and model the relationships between these entities through a knowledge graph. Then, by analyzing the user’s historical behavior and interest preferences, combined with semantic information in the knowledge graph, personalized news recommendations are generated. The Django framework has been chosen as the development platform for the system, providing a flexible web development environment that supports efficient data exchange and user management functions, making the system highly scalable and easy to maintain.
The experimental results show that the news recommendation system based on knowledge graph can more accurately capture the relationships between news content compared to traditional recommendation methods, improving the accuracy of recommendations and user satisfaction. In addition, the response speed and stability of the system have been effectively guaranteed, which can meet the needs of large-scale user access.
This study provides new ideas and methods for the further development of news recommendation systems, especially in the use of knowledge graphs for semantic understanding and personalized recommendations, which has strong innovation and application value.
Keywords:Knowledge graph; News recommendation system; Django framework; Personalized recommendations
目 录
1绪论
1.1 研究背景和意义
随着互联网的快速发展,新闻内容的生成和传播速度大幅提高,信息量急剧增长,导致用户面临信息过载的问题。传统的新闻获取方式逐渐无法满足用户对个性化和精准化内容的需求,如何从海量信息中筛选出用户感兴趣的新闻成为亟待解决的问题。新闻推荐系统通过分析用户的行为和兴趣,能够智能地向用户推送符合其需求的新闻,从而提高信息获取的效率和质量。
新闻推荐系统的研究不仅集中在提升推荐精准度,还关注如何处理新闻内容的多样性和复杂性。随着用户需求和新闻形式的变化,传统的推荐方法已无法有效捕捉新闻内容和用户需求之间的深层次关系,因此,新的研究着眼于多维度数据的融合,力求为用户提供更加个性化、丰富的推荐体验。
新闻推荐系统对新闻行业和用户体验具有重要意义。它不仅能帮助平台提高信息传播效率,增加用户粘性,还能提升内容生产者对受众需求的把握,优化新闻创作和传播方式。同时,推荐系统有助于用户更高效地获取感兴趣的新闻,减少信息过载,提高信息消费质量,促进社会信息的平衡传播。
尽管面临着数据处理和推荐多样性等挑战,新闻推荐系统的研究仍然对新闻传播领域及技术应用具有重要的理论价值和现实意义。
1.2 国内外研究现状
新闻推荐系统作为信息流通和传播的关键技术,近年来受到了学术界和工业界的广泛关注。随着互联网的普及和用户需求的多样化,传统的基于关键词匹配或协同过滤的推荐算法逐渐暴露出一些局限,无法有效地捕捉新闻内容之间的深层语义关系,进而影响推荐效果。因此,许多研究开始探索更加智能化和精准的新闻推荐方法,以满足用户对信息获取的高效和个性化需求。
在国外,早期的新闻推荐系统多基于协同过滤和内容推荐技术,侧重于用户行为数据和新闻内容的简单匹配。然而,随着用户对信息质量和多样性要求的提高,传统的推荐算法逐渐无法满足实际需求。近年来,国外的研究逐步转向更为复杂的推荐机制,包括结合社交网络数据、引入图谱信息等。通过将用户行为、新闻内容和外部知识源结合,研究者们提出了基于语义理解的新闻推荐模型,尤其是结合新闻主题和领域知识构建推荐系统的研究取得了重要进展。此外,国外部分研究开始探索如何通过多维度的数据融合,例如用户历史行为、新闻内容、新闻来源等,提升推荐的精准性和多样性。
国内的研究起步较晚,但近年来随着互联网应用的发展和用户行为数据的积累,国内的新闻推荐技术也取得了显著进展。国内学者大多集中于新闻推荐的个性化和高效性,尤其是在基于用户兴趣建模、新闻内容理解等方面取得了一定突破。许多研究围绕如何通过精确的用户画像和实时的新闻内容分析来提升推荐系统的准确性展开。此外,国内研究还广泛探讨了混合推荐方法,将传统的协同过滤、基于内容的推荐与知识图谱等先进技术结合,形成了更加智能化的推荐策略。部分国内研究也开始探索如何借助社交网络数据、情感分析等技术,进一步丰富推荐系统的应用场景。
尽管国内外的新闻推荐研究取得了一定的成果,但仍然面临诸多挑战。例如,如何构建高效且精确的用户画像,如何处理多模态数据的融合问题,以及如何保证推荐结果的实时性和高质量等,依然是当前研究的难点。此外,随着推荐系统应用的普及,如何平衡推荐的准确性和系统的透明性,如何避免推荐结果的偏见和过滤泡沫,仍然是学术界和工业界需要深入探讨的问题。
通过对国内外研究现状的回顾,可以看出,新闻推荐系统的发展已经从简单的匹配和过滤方法,逐步向融合多种技术、考虑用户多维度需求的方向发展。随着技术的不断进步,未来的新闻推荐系统有望更加智能、个性化和高效,进一步提升用户的新闻获取体验。
1.3 论文组成结构
第一章是绪论,本文章的开头部分,对本题目的研究背景和意义及研究现状等一些做文字性的描述。
第二章研究了新闻推荐系统的所采用的开发技术。
第三章是系统分析部分,包括可行性分析、功能需求分析、系统操作流程分析。
第四章是系统设计部分,本文章的重要部分,提供了系统架构的详细设计和一些主要功能模块的设计说明。
第五章是系统的具体实现,介绍系统的各个模块的具体实现。
第六章在前几章的基础上对系统进行测试和运行。
最后对系统进行了认真的总结,以此对未来有一个新的展望。
2相关技术介绍
2.1 B/S体系结构
B/S体系[1],即Browser/Server体系,是一种常见的网络应用程序架构。其工作原理基于客户端与服务器之间的请求-响应模型。用户通过浏览器向服务器发送请求,服务器接收到请求后进行处理,并生成相应的响应结果,最终将响应返回给客户端。浏览器接收到服务器返回的响应后,解析其中的标记语言(如HTML[2]),并根据CSS样式表和PythonScript脚本来渲染页面,呈现给用户。用户可以与页面进行交互,例如点击链接、填写表单等操作,这些操作会触发新的请求,循环执行上述过程。
2.2 Django框架
Django是一个使用Python语言开发的Web应用程序框架[3]。它提供了一种简单而强大的方式来构建复杂的网站和应用程序。通过使用Django,开发人员可以更轻松地处理数据库、创建用户界面和处理用户请求。它还提供了一个自动生成管理界面的功能,使得管理后台数据变得更加简单。Django还具有强大的安全功能,可以保护网站免受常见的网络攻击[4]。总之,Django是一个非常实用和易于学习的框架,适用于各种规模的Web项目。无论你是初学者还是经验丰富的开发人员,都可以从Django的便利性和灵活性中受益。
2.3 MySQL数据库
MySQL是一种广泛使用的开源关系型数据库管理系统[5](RDBMS),其稳定性、可靠性和卓越性能使其成为众多应用程序的首选数据库。MySQL支持标准SQL语法,并提供丰富的功能和特性,如事务处理、触发器和存储过程等,以满足开发者对数据管理和操作的需求。MySQL具有良好的可扩展性,支持主从复制、分布式架构和集群部署,适用于各种规模和负载的应用场景。作为一个开源项目,MySQL拥有庞大的用户社区和活跃的开发者社区,为用户提供了丰富的文档、教程和支持资源。总之,MySQL是一款可靠、强大且灵活的关系型数据库管理系统[6],通过其卓越性能和可扩展性,帮助开发者高效地管理和操作数据,并得到了广大用户的认可和应用。
2.4 Python语言
Python是一种简洁易读、跨平台且功能强大的编程语言[7]。它拥有庞大而活跃的社区,提供了丰富的第三方库和框架,如NumPy、Pandas和Django,使开发人员能够快速构建各种应用程序。Python在数据处理和科学计算方面表现出色,通过相关库和工具,可以进行数据分析、机器学习和科学计算等任务。此外,Python广泛应用于Web开发[8]、自动化脚本、网络爬虫等领域,其多样性使其成为一个全能的编程语言。无论你是初学者还是有经验的开发者,Python的简单语法、跨平台性以及强大的社区支持都能为你提供高效、优雅和可靠的编程体验。总之,Python是一个强大而灵活的编程语言,深受开发人员喜爱,并在各个领域得到广泛应用。
3系统分析
3.1 可行性分析
在软件开发的过程中,可行性分析是至关重要的,它旨在评估问题的可行性,以便尽可能快地解决,同时也要考虑到不同的解决方案的优势和劣势,以及实施这些方案所带来的经济效益。通过对新闻推荐系统的可行性分析,可以从技术、操作和经济三个方面来评估其可行性,从而为其提供有效的支持和保障。
3.1.1 技术可行性
在技术可行性方面,选择使用Python作为开发语言,结合相应的框架Django,以实现系统的功能需求。Python作为一种简洁而强大的编程语言,具有丰富的库支持和成熟的开发社区,可以满足系统的开发需求。Django作为Python的Web框架,提供了高度可扩展的开发环境,使得系统的设计和实现更加便捷和高效。
3.1.2 经济可行性
开发本系统的技术都是可以从网上直接免费下载,不用花一分钱,而且系统的源代码都是自己进行设计开发的,不需要额外的成本,如果后期想要进行运营,只要把配置到服务器上,花费服务器的租赁费用,在使用中可以进行增加广告收益,因此在经济方面是可行的。
3.1.3 操作可行性
在操作可行性方面,本系统设计注重用户体验,采用了直观易用的界面设计,并提供详细的帮助文档支持,确保用户可以轻松上手使用各项功能。无论是用户还是管理员,都能通过简洁明了的操作流程完成信息查询和管理等任务。因此,从用户操作的角度来看,本系统具备良好的操作可行性。
3.2 功能需求分析
功能需求分析是新闻推荐系统设计和开发的关键步骤,它旨在明确系统的功能和性能要求。以下是对新闻推荐系统的功能需求分析:
一、注册用户功能需求分析:
注册用户前台功能介绍
首页:用户登录后的首页,展示推荐的新闻和相关内容。
网站公告:展示由管理员发布的最新公告,确保用户能够及时获取重要信息。
新闻资讯:用户可以浏览各类新闻资讯,并根据兴趣进行选择。
热点新闻:展示当下最热门、最受关注的新闻,确保用户不遗漏重要事件。
新闻信息:提供详细的新闻内容,用户可以查看完整的新闻文本。
我的账号:用户管理个人账户信息,查看登录历史、修改个人资料等。
个人中心:提供用户查看和管理个人信息的功能,包括新闻订阅、收藏夹等。
个人中心:用户可查看和管理个人数据、偏好设置。
新闻信息:浏览和查看保存的新闻内容。
收藏:用户可以收藏感兴趣的新闻,方便以后查看。
注册用户后台功能介绍
主页:用户登录后的后台首页,展示用户相关的信息、通知等。
新闻信息:用户可以在后台查看自己浏览过的新闻或收藏的新闻,进行后续操作。
退出:用户可通过此功能退出后台管理,结束会话。
二、管理员功能需求分析:
主页:管理员登录后看到的首页,展示重要通知和系统概况。
公共管理:包括轮播图管理和网站公告。管理员可以更新和发布轮播图内容和网站公告,以保持信息的时效性和准确性。
用户管理:管理员可以管理注册用户的基本信息,如查看、编辑或删除用户,处理用户的权限分配等。
资讯管理:
新闻资讯:管理员可以发布和更新新闻内容。
资讯分类:管理员管理新闻类别,确保新闻内容根据不同主题进行分类。
退出:管理员可以通过此功能退出系统,结束管理会话。
新闻分类:管理员管理新闻的各个分类,确保分类信息与新闻内容的匹配。
热点新闻:管理员可选择和发布当前的热点新闻内容。
新闻信息:管理员可以管理所有新闻内容的详细信息,包括修改、删除等操作。
根据以上功能需求,得出以下用例图,注册用户用例图如下所示。

图3-1 注册用户用例图
管理员用例图如下所示。

图3-2 管理员用例图
3.3 系统操作流程分析
3.3.1信息添加流程
用户登录系统后,选择要添加的信息类型,填写相应的信息表单并提交。系统对信息进行处理,并给予用户反馈结果。用户可以根据需要返回上级页面或继续操作。

图3-3信息添加流程图
3.3.2信息删除流程
用户登录系统后,导航至相应的信息管理功能入口。选择要删除的信息,并确认删除操作。系统进行删除处理,并给予用户反馈结果。用户可以根据需要返回上级页面或继续操作。

4系统设计
4.1 系统架构设计
新闻推荐系统的架构设计包括客户端、服务器端、第三方集成、安全性和权限控制、扩展性和性能优化、高可用性和容错性等方面。客户端通过Web浏览器或移动应用程序访问系统,而服务器端负责接收和处理请求,并提供功能和数据。系统采用分层架构,包括表现层、业务逻辑层、数据访问层和数据库。同时,系统需考虑与其他系统的集成、安全性和权限控制、扩展性和性能优化、高可用性和容错性等方面的问题。这样的架构设计将确保系统的稳定性、可扩展性和安全性,为用户提供稳定、高效的使用体验。系统架构图如下图所示。

图4-1 系统架构图
4.2 系统功能结构
系统功能结构是将一个系统的各种功能以有组织、结构化的方式描述和组织的过程。它涉及系统中不同组成部分之间的相互关系和交互作用,以及它们如何协同实现整体目标。系统功能结构对于确保系统正常运行和高效性至关重要。通常,系统功能结构包括功能模块、数据流、控制流和界面等几个方面。功能模块是实现特定功能的基本单元,通过数据流进行信息交换,并受到控制流的调度和控制。数据流描述了系统中信息的传递和处理过程,可以是模块间的数据传输或输入输出之间的数据传递。系统的功能结构图如下所示。

图4-2 系统功能结构图
4.3 数据库设计
数据库设计是指在构建和组织数据库系统时,根据实际需求和目标,进行数据模型的设计和规划的过程。它涉及到确定数据库中的表、字段、关系以及约束等方面的设计决策。
4.3.1 数据库实体设计
数据库实体设计是数据库设计的关键步骤,对实际业务逻辑中涉及的实体及其属性进行抽象建模,明确系统中的主要信息对象及其关系[9]。在实体设计中,根据需求分析确定系统的核心实体,如用户、角色、权限等,提取实体的主要属性,如用户的ID、姓名、联系方式,名称、类型等,同时定义各实体之间的关系,包括一对一、一对多、多对多等。在设计过程中,注重实体的完整性、规范性和唯一性,确保设计能够满足系统功能需求,并为后续的表设计提供清晰的结构框架。实体设计需遵循数据库设计的标准化要求,避免数据冗余和不必要的复杂度。
下面是整个系统中主要的数据库表总E-R实体关系图。

图4-3 系统E-R图
4.3.2 数据库表设计
数据库表设计基于实体设计,将抽象的实体映射为具体的表结构。设计过程中,为每个实体定义表名、字段名及数据类型[10]。根据业务需求,合理定义主键、外键及约束条件,确保表之间的关联性,例如通过外键建立用户表和角色表之间的关系。表设计时注重数据存储的完整性、一致性,并通过索引优化查询效率,最终确保数据库结构能够支持系统的功能需求。以下是系统的数据库表设计展示。
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
token_id |
int |
|
是 |
是 |
临时访问牌ID |
|
2 |
token |
varchar |
64 |
否 |
否 |
临时访问牌 |
|
3 |
info |
text |
65535 |
否 |
否 |
信息 |
|
4 |
maxage |
int |
|
是 |
否 |
最大寿命:默认2小时 |
|
5 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
6 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
|
7 |
user_id |
int |
|
是 |
否 |
用户编号 |
表 4-2-article(文章)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
article_id |
mediumint |
|
是 |
是 |
文章id |
|
2 |
title |
varchar |
125 |
是 |
是 |
标题 |
|
3 |
type |
varchar |
64 |
是 |
否 |
文章分类 |
|
4 |
hits |
int |
|
是 |
否 |
点击数 |
|
5 |
praise_len |
int |
|
是 |
否 |
点赞数 |
|
6 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
7 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
|
8 |
source |
varchar |
255 |
否 |
否 |
来源 |
|
9 |
url |
varchar |
255 |
否 |
否 |
来源地址 |
|
10 |
tag |
varchar |
255 |
否 |
否 |
标签 |
|
11 |
content |
longtext |
4294967295 |
否 |
否 |
正文 |
|
12 |
img |
varchar |
255 |
否 |
否 |
封面图 |
|
13 |
description |
text |
65535 |
否 |
否 |
文章描述 |
表 4-3-article_type(文章分类)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
type_id |
smallint |
|
是 |
是 |
分类ID |
|
2 |
display |
smallint |
|
是 |
否 |
显示顺序 |
|
3 |
name |
varchar |
16 |
是 |
否 |
分类名称 |
|
4 |
father_id |
smallint |
|
是 |
否 |
上级分类ID |
|
5 |
description |
varchar |
255 |
否 |
否 |
描述 |
|
6 |
icon |
text |
65535 |
否 |
否 |
分类图标 |
|
7 |
url |
varchar |
255 |
否 |
否 |
外链地址 |
|
8 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
9 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
表 4-4-auth(用户权限管理)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
auth_id |
int |
|
是 |
是 |
授权ID |
|
2 |
user_group |
varchar |
64 |
否 |
否 |
用户组 |
|
3 |
mod_name |
varchar |
64 |
否 |
否 |
模块名 |
|
4 |
table_name |
varchar |
64 |
否 |
否 |
表名 |
|
5 |
page_title |
varchar |
255 |
否 |
否 |
页面标题 |
|
6 |
path |
varchar |
255 |
否 |
否 |
路由路径 |
|
7 |
parent |
varchar |
64 |
否 |
否 |
父级菜单 |
|
8 |
parent_sort |
int |
|
是 |
否 |
父级菜单排序 |
|
9 |
position |
varchar |
32 |
否 |
否 |
位置 |
|
10 |
mode |
varchar |
32 |
是 |
否 |
跳转方式 |
|
11 |
add |
tinyint |
|
是 |
否 |
是否可增加 |
|
12 |
del |
tinyint |
|
是 |
否 |
是否可删除 |
|
13 |
set |
tinyint |
|
是 |
否 |
是否可修改 |
|
14 |
get |
tinyint |
|
是 |
否 |
是否可查看 |
|
15 |
field_add |
text |
65535 |
否 |
否 |
添加字段 |
|
16 |
field_set |
text |
65535 |
否 |
否 |
修改字段 |
|
17 |
field_get |
text |
65535 |
否 |
否 |
查询字段 |
|
18 |
table_nav_name |
varchar |
500 |
否 |
否 |
跨表导航名称 |
|
19 |
table_nav |
varchar |
500 |
否 |
否 |
跨表导航 |
|
20 |
option |
text |
65535 |
否 |
否 |
配置 |
|
21 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
22 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
表 4-5-code_token(验证码)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
code_token_id |
int |
|
是 |
是 |
验证码ID |
|
2 |
token |
varchar |
255 |
否 |
否 |
令牌 |
|
3 |
code |
varchar |
255 |
否 |
否 |
验证码 |
|
4 |
expire_time |
timestamp |
|
是 |
否 |
失效时间 |
|
5 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
6 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
表 4-6-collect(收藏)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
collect_id |
int |
|
是 |
是 |
收藏ID |
|
2 |
user_id |
int |
|
是 |
是 |
收藏人ID |
|
3 |
source_table |
varchar |
255 |
否 |
否 |
来源表 |
|
4 |
source_field |
varchar |
255 |
否 |
否 |
来源字段 |
|
5 |
source_id |
int |
|
是 |
否 |
来源ID |
|
6 |
title |
varchar |
255 |
否 |
否 |
标题 |
|
7 |
img |
varchar |
255 |
否 |
否 |
封面 |
|
8 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
9 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
表 4-7-comment(评论)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
comment_id |
int |
|
是 |
是 |
评论ID |
|
2 |
user_id |
int |
|
是 |
是 |
评论人ID |
|
3 |
reply_to_id |
int |
|
是 |
否 |
回复评论ID |
|
4 |
content |
longtext |
4294967295 |
否 |
否 |
内容 |
|
5 |
nickname |
varchar |
255 |
否 |
否 |
昵称 |
|
6 |
avatar |
varchar |
255 |
否 |
否 |
头像地址 |
|
7 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
8 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
|
9 |
source_table |
varchar |
255 |
否 |
否 |
来源表 |
|
10 |
source_field |
varchar |
255 |
否 |
否 |
来源字段 |
|
11 |
source_id |
int |
|
是 |
否 |
来源ID |
表 4-8-hits(用户点击)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
hits_id |
int |
|
是 |
是 |
点赞ID |
|
2 |
user_id |
int |
|
是 |
否 |
点赞人 |
|
3 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
4 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
|
5 |
source_table |
varchar |
255 |
否 |
否 |
来源表 |
|
6 |
source_field |
varchar |
255 |
否 |
否 |
来源字段 |
|
7 |
source_id |
int |
|
是 |
否 |
来源ID |
表 4-9-hot_news(热点新闻)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
hot_news_id |
int |
|
是 |
是 |
热点新闻ID |
|
2 |
news_headlines |
varchar |
64 |
否 |
否 |
新闻标题 |
|
3 |
news_type |
varchar |
64 |
否 |
否 |
新闻类型 |
|
4 |
publisher |
varchar |
64 |
否 |
否 |
发布人 |
|
5 |
reporting_time |
datetime |
|
否 |
否 |
报道时间 |
|
6 |
source |
varchar |
64 |
否 |
否 |
来源 |
|
7 |
news_video |
varchar |
255 |
否 |
否 |
新闻视频 |
|
8 |
news_cover |
varchar |
255 |
否 |
否 |
新闻封面 |
|
9 |
news_body |
longtext |
4294967295 |
否 |
否 |
新闻正文 |
|
10 |
hits |
int |
|
是 |
否 |
点击数 |
|
11 |
praise_len |
int |
|
是 |
否 |
点赞数 |
|
12 |
collect_len |
int |
|
是 |
否 |
收藏数 |
|
13 |
comment_len |
int |
|
是 |
否 |
评论数 |
|
14 |
recommend |
int |
|
是 |
否 |
智能推荐 |
|
15 |
create_time |
datetime |
|
是 |
否 |
创建时间 |
|
16 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
表 4-10-news_classification(新闻分类)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
news_classification_id |
int |
|
是 |
是 |
新闻分类ID |
|
2 |
news_type |
varchar |
64 |
否 |
否 |
新闻类型 |
|
3 |
create_time |
datetime |
|
是 |
否 |
创建时间 |
|
4 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
表 4-11-news_information(新闻信息)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
news_information_id |
int |
|
是 |
是 |
新闻信息ID |
|
2 |
news_headlines |
varchar |
64 |
否 |
否 |
新闻标题 |
|
3 |
news_type |
varchar |
64 |
否 |
否 |
新闻类型 |
|
4 |
publisher |
int |
|
否 |
否 |
发布人 |
|
5 |
reporting_time |
datetime |
|
否 |
否 |
报道时间 |
|
6 |
source |
varchar |
64 |
否 |
否 |
来源 |
|
7 |
news_cover |
varchar |
255 |
否 |
否 |
新闻封面 |
|
8 |
news_body |
longtext |
4294967295 |
否 |
否 |
新闻正文 |
|
9 |
hits |
int |
|
是 |
否 |
点击数 |
|
10 |
praise_len |
int |
|
是 |
否 |
点赞数 |
|
11 |
collect_len |
int |
|
是 |
否 |
收藏数 |
|
12 |
comment_len |
int |
|
是 |
否 |
评论数 |
|
13 |
examine_state |
varchar |
16 |
是 |
否 |
审核状态 |
|
14 |
create_time |
datetime |
|
是 |
否 |
创建时间 |
|
15 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
表 4-12-notice(公告)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
notice_id |
mediumint |
|
是 |
是 |
公告ID |
|
2 |
title |
varchar |
125 |
是 |
否 |
标题 |
|
3 |
content |
longtext |
4294967295 |
否 |
否 |
正文 |
|
4 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
5 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
表 4-13-praise(点赞)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
praise_id |
int |
|
是 |
是 |
点赞ID |
|
2 |
user_id |
int |
|
是 |
是 |
点赞人 |
|
3 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
4 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
|
5 |
source_table |
varchar |
255 |
否 |
否 |
来源表 |
|
6 |
source_field |
varchar |
255 |
否 |
否 |
来源字段 |
|
7 |
source_id |
int |
|
是 |
否 |
来源ID |
|
8 |
status |
tinyint |
|
是 |
否 |
点赞状态:1为点赞,0已取消 |
表 4-14-registered_user(注册用户)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
registered_user_id |
int |
|
是 |
是 |
注册用户ID |
|
2 |
user_name |
varchar |
64 |
否 |
否 |
用户姓名 |
|
3 |
user_gender |
varchar |
64 |
否 |
否 |
用户性别 |
|
4 |
contact_information |
varchar |
16 |
否 |
否 |
联系方式 |
|
5 |
examine_state |
varchar |
16 |
是 |
否 |
审核状态 |
|
6 |
user_id |
int |
|
是 |
否 |
用户ID |
|
7 |
create_time |
datetime |
|
是 |
否 |
创建时间 |
|
8 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
表 4-15-slides(轮播图)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
slides_id |
int |
|
是 |
是 |
轮播图ID |
|
2 |
title |
varchar |
64 |
否 |
否 |
标题 |
|
3 |
content |
varchar |
255 |
否 |
否 |
内容 |
|
4 |
url |
varchar |
255 |
否 |
否 |
链接 |
|
5 |
img |
varchar |
255 |
否 |
否 |
轮播图 |
|
6 |
hits |
int |
|
是 |
否 |
点击量 |
|
7 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
8 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
表 4-16-upload(文件上传)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
upload_id |
int |
|
是 |
是 |
上传ID |
|
2 |
name |
varchar |
64 |
否 |
否 |
文件名 |
|
3 |
path |
varchar |
255 |
否 |
否 |
访问路径 |
|
4 |
file |
varchar |
255 |
否 |
否 |
文件路径 |
|
5 |
display |
varchar |
255 |
否 |
否 |
显示顺序 |
|
6 |
father_id |
int |
|
否 |
否 |
父级ID |
|
7 |
dir |
varchar |
255 |
否 |
否 |
文件夹 |
|
8 |
type |
varchar |
32 |
否 |
否 |
文件类型 |
表 4-17-user(用户账户)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
user_id |
int |
|
是 |
是 |
用户ID |
|
2 |
state |
smallint |
|
是 |
否 |
账户状态:(1可用|2异常|3已冻结|4已注销) |
|
3 |
user_group |
varchar |
32 |
否 |
否 |
所在用户组 |
|
4 |
login_time |
timestamp |
|
是 |
否 |
上次登录时间 |
|
5 |
phone |
varchar |
11 |
否 |
否 |
手机号码 |
|
6 |
phone_state |
smallint |
|
是 |
否 |
手机认证:(0未认证|1审核中|2已认证) |
|
7 |
username |
varchar |
16 |
是 |
否 |
用户名 |
|
8 |
nickname |
varchar |
16 |
否 |
否 |
昵称 |
|
9 |
password |
varchar |
64 |
是 |
否 |
密码 |
|
10 |
|
varchar |
64 |
否 |
否 |
邮箱 |
|
11 |
email_state |
smallint |
|
是 |
否 |
邮箱认证:(0未认证|1审核中|2已认证) |
|
12 |
avatar |
varchar |
255 |
否 |
否 |
头像地址 |
|
13 |
open_id |
varchar |
255 |
否 |
否 |
针对获取用户信息字段 |
|
14 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
表 4-18-user_group(用户组)
|
编号 |
字段名 |
类型 |
长度 |
是否非空 |
是否主键 |
注释 |
|
1 |
group_id |
mediumint |
|
是 |
是 |
用户组ID |
|
2 |
display |
smallint |
|
是 |
否 |
显示顺序 |
|
3 |
name |
varchar |
16 |
是 |
否 |
名称 |
|
4 |
description |
varchar |
255 |
否 |
否 |
描述 |
|
5 |
source_table |
varchar |
255 |
否 |
否 |
来源表 |
|
6 |
source_field |
varchar |
255 |
否 |
否 |
来源字段 |
|
7 |
source_id |
int |
|
是 |
否 |
来源ID |
|
8 |
register |
smallint |
|
否 |
否 |
注册位置 |
|
9 |
create_time |
timestamp |
|
是 |
否 |
创建时间 |
|
10 |
update_time |
timestamp |
|
是 |
否 |
更新时间 |
5关键模块的设计与实现
新闻推荐系统的详细设计与实现主要是根据前面的新闻推荐系统的需求分析和新闻推荐系统的总体设计来设计页面并实现业务逻辑。主要从新闻推荐系统界面实现、业务逻辑实现这两部分进行介绍。
5.1注册用户功能模块
5.1.1 用户注册界面
注册模块满足用户两部分,当用户想要进行资料相关信息的查询管理的时候,就必须进行登录,如果没有账号的话,在登录界面,点击“注册”按钮就会跳转到注册的界面,根据提示填写好注册信息,添加提交,注册的信息在数据库中就添加完成了,然后再输入填写好的账号和密码进行登录,其注册主界面展示如下图所示。

图5-1用户注册界面图
5.1.2 用户登录界面
用户是可以通过自己的账户名和密码进行登录的,当用户输入完整的自己的账户名和密码信息并点击“登录”按钮后,将会首先验证输入的有没有空数据,再次验证输入的账户名+密码和数据库中当前保存的用户信息是否一致,只有在一致后将会登录成功并自动跳转到系统的首页中;否则将会提示相应错误信息,用户登录界面如下图所示。

图5-2用户登录界面图
登录代码:
def Login(self, ctx):
print(“===================登录=====================”)
ret = {
“error”: {
“code”: 70000,
“message”: “账户不存在”,
}
}
body = ctx.body
password = md5hash(body[“password”]) or “”
obj = service_select(“user”).Get_obj(
{“username”: body[“username”]}, {“like”: False}
)
if obj:
user_group = service_select(“user_group”).Get_obj({‘name’: obj[‘user_group’]}, {“like”: False})
if user_group and user_group[‘source_table’] != ”:
user_obj = service_select(user_group[‘source_table’]).Get_obj({“user_id”: obj[‘user_id’]}, {“like”: False})
if user_obj[‘examine_state’] == ‘未通过’:
ret = {
“error”: {
“code”: 70000,
“message”: “账户未通过审核”,
}
}
return ret
if user_obj[‘examine_state’] == ‘未审核’:
ret = {
“error”: {
“code”: 70000,
“message”: “账户未审核”,
}
}
return ret
if obj[“state”] == 1:
if obj[“password”] == password:
timeout = timezone.now()
timestamp = int(time.mktime(timeout.timetuple())) * 1000
token = md5hash(str(obj[“user_id”]) + “_” + str(timestamp))
ctx.request.session[token] = obj[“user_id”]
service_select(“access_token”).Add(
{“token”: token, “user_id”: obj[“user_id”]}
)
obj[“token”] = token
ret = {
“result”: {“obj”: obj}
}
else:
ret = {
“error”: {
“code”: 70000,
“message”: “密码错误”,
}
}
else:
ret = {
“error”: {
“code”: 70000,
“message”: “用户账户不可用,请联系管理员”,
}
}
return ctx.response(json.dumps(ret, ensure_ascii=False))
5.1.3 新闻资讯界面
用户在资讯页面浏览新闻资讯信息。通过分类标签筛选资讯类型,点击标题查看详细文章,页面提供评论区供用户交流心得。新闻资讯界面如下图所示。

图5-3新闻资讯界面图
5.1.4热点新闻界面
用户进入热点新闻页面,浏览热点新闻的图片、名称、描述等基本信息。通过搜索栏输入关键词或筛选条件,快速定位热点新闻界面,可以点赞、收藏和评论。热点新闻界面如下图所示。

图5-4热点新闻界面图
5.1.5新闻信息界面
用户进入新闻信息页面,浏览新闻信息的图片、名称、描述等基本信息。通过搜索栏输入关键词或筛选条件,快速定位新闻信息界面,可以点赞、收藏和评论。新闻信息界面如下图所示。

图5-5新闻信息界面图
查看新闻信息代码如下:
def Get_obj(self, ctx):
query = dict(ctx.query)
config_plus = {}
if “field” in query:
field = query.pop(“field”)
config_plus[“field”] = field
obj = self.service.Get_obj(query, obj_update(self.config, config_plus))
if self.service.error:
return {“error”: self.service.error}
if obj:
self.interact_obj(ctx, obj)
return {“result”: {“obj”: obj}}
5.1.6网站公告界面
展示由管理员发布的最新公告,确保用户能够及时获取重要信息。网站公告界面如下图所示。

图5-6网站公告界面图
5.2管理员功能模块
5.2.1用户管理界面
管理员可以管理系统的用户,包括添加新用户、编辑用户信息、修改用户信息等操作,以确保系统的权限管理和安全性。用户管理界面如下图所示。

图5-7用户管理界面图
5.2.2资讯管理界面
新闻资讯:管理员负责发布、编辑和删除新闻内容。新闻资讯部分包括新闻标题、正文内容、图片、视频等多种媒体形式,管理员需要确保内容的准确性和时效性。
资讯分类:管理员能够对新闻进行分类管理,将新闻按照不同主题、领域或标签进行分类,帮助用户更方便地浏览相关信息。管理员还可以调整分类名称、顺序等,以提升用户体验。资讯管理界面如下图所示。

图5-8资讯管理界面图
添加资讯代码如下:
def Add(self, ctx):
body = ctx.body
unique = self.config.get(“unique”)
obj = None
if unique:
qy = {}
for i in range(len(unique)):
key = unique[i]
qy[key] = body.get(key)
obj = self.service.Get_obj(qy)
if not obj:
error = self.Add_before(ctx)
if error[“code”]:
return {“error”: error}
error = self.Events(“add_before”, ctx, None)
if error[“code”]:
return {“error”: error}
result = self.service.Add(body, self.config)
if self.service.error:
return {“error”: self.service.error}
res = self.Add_after(ctx, result)
if res:
result = res
res = self.Events(“add_after”, ctx, result)
if res:
result = res
return {“result”: result}
else:
return {“error”: {“code”: 10000, “message”: “已存在”}}
5.2.3轮播图界面
管理员管理网站首页的轮播图内容,确保重要信息得到及时展示。添加、修改、删除轮播图:保证轮播图展示的信息与时俱进。轮播图界面如下图所示。

图5-9轮播图界面图
5.2.4网站公告界面
管理员可以发布、修改和删除系统内的通知公告。发布重要信息,确保用户及时获取重要消息。网站公告界面如下图所示。

图5-10网站公告界面图
删除公告通知代码如下:
def Del(self, ctx):
if len(ctx.query) == 0:
errorMsg = {“code”: 30000, “message”: “删除条件不能为空!”}
return errorMsg
result = self.service.Del(ctx.query, self.config)
if self.service.error:
return {“error”: self.service.error}
return {“result”: result}
5.2.5新闻分类界面
管理员不仅可以管理新闻内容,还能在系统中设定不同的新闻分类,以便用户根据兴趣选择相应的新闻类别,提升用户个性化体验。新闻分类界面如下图所示。

图5-11新闻分类界面图
5.2.6热点新闻界面
管理员负责管理网站的热点新闻区域,选择当前最受关注的新闻,推送给用户。这有助于提高用户粘性和新闻的曝光率。热点新闻界面如下图所示。

图5-12热点新闻界面图
5.2.7新闻信息界面
管理员可以查看和编辑已发布的新闻信息,包括对新闻内容的修改、删除或更新。这确保了新闻信息的准确性和及时性。新闻信息界面如下图所示。

图5-13新闻信息界面图
6 系统测试
新闻推荐系统测试是为了检验软件是否达到设计要求,是否存在错误,通过测试的方法来检查新闻推荐系统,以便发现新闻推荐系统中的错误。测试工作是保证新闻推荐系统质量的关键。
6.1系统测试
用户查看新闻信息功能测试:
表6-1用户查看新闻信息功能测试用例表
|
测试名称 |
测试功能 |
操作 |
操作过程 |
预期结果 |
测试结果 |
|
用户查看新闻信息功能模块测试 |
用户查看新闻信息功能成功 |
点击“新闻信息” |
点击某一条“新闻信息”,查看新闻信息详情。 |
成功查看新闻信息。 |
正确 |
用户查看新闻资讯功能测试:
表6-2用户查看新闻资讯功能测试用例表
|
测试名称 |
测试功能 |
操作 |
操作过程 |
预期结果 |
测试结果 |
|
用户查看新闻资讯功能模块测试 |
用户查看新闻资讯功能成功 |
点击“新闻资讯” |
点击某一条“新闻资讯”信息,查看新闻资讯详情。 |
成功查看新闻资讯。 |
正确 |
管理员发布新闻信息功能测试:
表6-3管理员发布新闻信息功能测试用例表
|
测试名称 |
测试功能 |
操作 |
操作过程 |
预期结果 |
测试结果 |
|
管理员发布新闻信息功能测试 |
添加新闻信息的情况 |
输入新新闻信息的基本信息 |
后台选择“新闻信息管理”菜单后,填写新新闻信息后点击“提交”按钮 |
新新闻信息发布成功 |
正确 |
6.2测试结果
通过编写了新闻推荐系统的测试用例,已经检测完毕了6章节中的3大模块,它为新闻推荐系统系统的后期推广运营提供了强力的技术支撑。
结 论
在开发新闻推荐系统之前,我们进行了详尽的需求调研和技术研究。通过网上查询和线下问卷调查,我们深入了解了用户对新闻推荐系统的具体需求,并研究了现有的新闻推荐系统功能及其开发背景。同时,对新闻推荐系统的研究现状进行了梳理,为系统设计提供了理论支持。在明确了系统功能后,我们精心选择了开发工具:采用流行的Python语言和Django框架进行开发,并利用开源的MySQL数据库进行数据存储。接着,我们对系统进行了需求分析,包括可行性、性能、功能和用例等方面的分析,以确保系统的实用性和稳定性。在完成系统设计和数据库设计后,我们开始了系统的开发工作,并最终完成了系统的测试和总结。
在开发过程中,我收获颇丰,不仅学习到了许多书本上没有的知识,还提升了自己的实践能力和解决问题的能力。虽然目前系统已经初步完成,但仍有待进一步改进和完善,例如界面布局的优化和代码编写的提升等。由于我的专业知识有限,系统可能存在一些不足和缺陷,我将继续努力学习和改进,以期将系统做得更加完美。我希望能有机会将系统投入到学校的实际使用中,为同学们提供便捷的服务。
参考文献
- 黄维.基于B/S模式的虚拟网络宠物安全管理体系分析[J].信息系统工程,2024,(05):4-7.
- 张宇薇.HTML5在Web前端开发中的应用[J].集成电路应用,2024,41(04):274-276.
- 邱红丽,张舒雅.基于Django框架的web项目开发研究[J].科学技术创新,2021,(27):97-98.
- 段艺,涂伟忠.Django开发从入门到实践[M].机械工业出版社:202211.635.
- 李艳杰.MySQL数据库下存储过程的综合运用研究[J].现代信息科技,2023,7(11):80-82+88.
- 肖睿,李鲲程,范效亮,等.MySQL数据库应用技术及实践[M].人民邮电出版社:202206.228.
- 明日科技.快速上手Python[M].化学工业出版社:202211.337.
- 明日科技.Python Web开发手册[M].化学工业出版社:202201.411.
- 马艳艳,吴晓光.计算机软件与数据库的设计策略分析[J].电子技术,2024,53(05):104-105.
- 李俊萌.计算机软件测试技术与开发应用策略分析[J].信息记录材料,2023,24(03):50-52.
- 黄华靖,韩梅,刘康民,等.基于RippleNet的实体加权新闻推荐[J].西华大学学报(自然科学版),2025,44(02):79-86.
- 朱士玲,叶青,陈春娣,等.融合多源信息的新闻推荐系统设计与实现[J].信息与电脑,2025,37(03):120-122.
- Liang J .Teaching Reform and Exploration of Python Programming Course Based on Knowledge Graph[J].Journal of Educational Research and Policies,2025,7(1):24-29.
- 王梓懿.大数据时代基于用户行为的新闻推荐机制分析[J].新闻研究导刊,2025,16(02):6-9.DOI:10.26918/j.xwyjdk.2025.02.002.
- 徐钲槟.基于CLIP的事件与流行度感知的图文新闻推荐模型研究[D].广西民族大学,2024.DOI:10.27035/d.cnki.ggxmc.2024.001600.
- Wang S ,Deng C ,Zhu J .Exploration of the Application of Flipped Classroom in Computer Programming Python Language[J].Journal of Intelligence and Knowledge Engineering,2024,2(4):
- Lei L .A Probe Into the Mixed Teaching Reform of Python Language Programming[J].Journal of Electronic Research and Application,2024,8(6):66-71.
- 陈宇.Word2Vec新闻推荐系统设计与实现——基于Attention机制与Embedding优化[J].情报探索,2024,(10):88-96.
- 郝爽.基于用户长短期兴趣的智慧养老新闻推荐系统的设计与实现[D].内蒙古大学,2024.
- 田子明.基于事件感知的新闻推荐系统设计与实现[D].北京邮电大学,2024.
致谢
在这篇论文的撰写过程中,我深感“砥砺前行,勇往直前”的道理。正如成语所说,“千里之行,始于足下”。无论面对多么艰难的挑战,只要我们保持坚定的信念和努力的态度,就能够攻克困难,实现自己的目标。
同时,我们也要明白“世上无难事,只怕有心人”的道理。通过不断学习和积累知识,我们能够拓展自己的视野,提升自己的能力。正如一句古训所说:“读书破万卷,下笔如有神”,只有通过不断学习和锤炼才能够成为真正的专家和领导者。
在攻克困难的过程中,我们也要保持“与时俱进”的意识。正如成语所说:“时不我待”。在一个日新月异的时代,只有跟上时代的步伐,不断更新自己的知识和技能,才能立于不败之地。
最后,我要引用一句励志的名言:“成功源于自信,自信源于经验,经验源于失败”。在追求梦想的道路上,我们可能会遇到许多挫折和失败,但正是通过这些经历,我们能够积累宝贵的经验,提升自己的能力,并最终实现自己的目标。
在本文的写作过程中,这些励志的成语和名言一直激励着我,让我坚持不懈,追求卓越。希望这些励志的言辞也能够激励和鼓舞其他人,在追逐自己的梦想的道路上勇往直前,不断超越自我!
请关注点赞+私信博主,免费领取项目源码
文章来源于互联网:基于知识图谱的新闻推荐系统研究-计算机毕设 附源码 01288
5bei.cn大模型教程网










