你将学到的
  • 搜索引擎架构设计
  • 爬虫的基本概念
  • 基于 Ruia 构造异步爬虫系统
  • 对文档数据进行处理
  • 实现倒排索引的压缩
  • 异步爬虫框架 Sanic
  • 实现前后端交互
  • 搜索引擎的必要组件
  • 异步爬虫框架 Ruia
  • 索引结构的使用
  • 实现 ElasGamma 算法的编码与解码
  • 文档的搜索功能
  • 编写搜索引擎前端
  • 搜索结果排名
lab-classic 实验 1 搜索引擎架构

知识点: 1.介绍本课程实现的搜索引擎的架构设计 2.介绍搜索引擎所必要的组件 3.对课程项目进行开发环境的部署和配置 4.创建项目及必要的代码目录

lab-classic 实验 2 构建爬虫系统

知识点: 1.爬虫的基本概念 2.异步爬虫框架ruia的使用介绍 3.基于ruia构造异步爬虫系统

lab-classic 实验 3 索引结构的实现

知识点: 1.索引的基本概念 2.构建倒排索引 3.对文档数据进行处理

知识点: 1.为什么要进行索引压缩 2.倒排索引的优化方法 3.实现EliasGamma算法的编码与解码 4.实现倒排索引的压缩 5.实现文档的搜索功能

lab-classic 实验 5 实现搜索引擎前端以及后端

知识点: 1.异步Web框架Sanic 2.使用Sanic搭建后端服务 3.编写搜索引擎前端 4.实现前后端交互

lab-classic 实验 6 搜索结果排名

知识点: 1.CosineSimiliarity 2.PageRank

lab-classic 实验 7 搜索引擎的功能扩展

知识点: 1.为搜索关键词结果编写页面缓存功能

课程介绍

01 02 03

课程教师

howie.hu 共发布过 1 门课程

Ptyhon开发者,热爱开源,异步爬虫框架Ruia作者,Sanic框架贡献者 Github地址:https://github.com/howie6879

查看老师的所有课程 >
实验楼楼+
实验楼会员