大模型必知必会的问题及答案 以问题为导向来检验自己学习的效果。以下是一些大模型必知必会的问题,快来检查一下掌握程度吧~ 数据预处理 1.什么是 BPE?它如何工作? Byte Pair Encoding (BPE),又称 digram coding 双字母组合编码,是一种数据压缩 算法,用来在固定大小的词表中实现可变⻓度的子词。该算法简单有效,因而目前它是最流行的方法。 2025-01-16 NLP #NLP
Fluid-7-添加星系loading动画 Hexo博客主题为Fluid 1.在themes\fluid\layout\_partials\路径下创建loading.ejs,内容参考: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869 2025-01-15 博客 #hexo
Fluid-6-导航栏标题添加霓虹灯特效 注意 主题为Fluid!!!! 修改themes\fluid\source\css\_pages\_base\_widget\header.styl,在里面追加样式(注意缩进): 1234567891011.navbar-title outline none --c lightseagreen text-shadow 0 0 10px var(--c),0 0 20px var(--c) 2025-01-15 博客 #hexo
Fluid-5-主题美化之添加Live2D看板娘 此功能将会使得 博客网站上有2D的小漫画人物或者萌宠陪伴~ 安装Live2D插件1、进入Hexo根目录 2、打开Git Bash,输入以下命令进行安装: 1npm install --save hexo-helper-live2d 添加自定义配置1、打开Hexo根目录下的配置文件 2、在合适位置处添加以下内容 1234567891011121314151617181920212223242 2025-01-14 博客 #hexo
一文读懂transform原理及代码实现 0 引言由于之前的模型,例如Seq2Seq模型有如下缺点,所以导致了transformer的诞生~ 上下文向量信息压缩 输入序列的全部信息需要被编码成一个固定维度的上下文向量,用这个固定的向量来表示编码器的全部信息,这样会导致信息的损耗。 无法并行 Seq2Seq模型在处理长序列时存在短期记忆限制,难以有效捕获和传递长期依赖性。本质上和RNN/LSTM无法并行的原因一样。 对于 RN 2025-01-13 #Deep Learning
Fluid-4-添加博客加载页面 前言加载动画可以缓解用户等待页面加载的不适感,给予用户一个明确的指示,告诉他们页面正在加载中。这有助于提升用户体验,减轻用户的焦虑感,让他们 感觉 页面加载速度更快。 😄实现思路 html + css 创建动画页面 调用 js 加载 dom 事件来控制加载动画消失 😊实现方法动画照搬了一个示例 ~ 新建一个loading样式css将以下代码放进去 然后引用这个文件 在 bodyBegin 注 2025-01-13 博客 #hexo
Fluid-3-增加打赏功能 添加流程修改 找到主题布局文件 themes/fluid/layout/post.ejs 将以下代码粘贴到文章模板的 </div> 和 <hr> 之间 1.增加 html1234567891011121314151617181920212223<!-- 添加打赏模块 --><div class="reward-container"> 2025-01-13 博客 #hexo
Fluid-2-添加 Github 贡献表 本文记录在 Fluid 主题中加入 Github 贡献表的方法。 1.贡献表 Github Chart 是什么呢?就是个人主页的那些绿块,组成了绿色日历Github 的提交记录: 本质上这个表格是使用了 Github API 提取数据生成的图表,我们如果想在博客里添加贡献表可以用这个思路 🔧ghchart 2016rshah 大佬提供了现成的 API 可以直接生成贡献图表 官网地址: 2025-01-13 博客 #hexo
一文读懂大数据各组件 在还没接触大数据的时候,着实被那么多技术组件和平台架构吓到了,以下列举一些 Druid、Kudu、ClickHouse、Flink、Spark 、Storm、Impala、Presto、Hive、Kafka、RabbitMQ、Canal、Doris、Apache Airflow、Oozie、Azkaban、DolphinScheduler、HDFS、YARN、MapReduce、Hive、HBas 2024-12-26 大数据 #大数据
python爬取指定微博用户并基于微博内容生成词云图 😄程序用途 该程序用来对感兴趣的微博博主进行分析,根据微博内容生成词云图,效果如下: 📌一.爬取指定博主的微博内容 爬虫部分主要利用Requests包爬取相应的信息,感兴趣大家可以自行阅读代码,这里主要介绍词云的生成,就不展开说爬虫程序了~ 爬虫全部代码:https://github.com/YUTING0907/pythonTools/tree/main/WeiboCrawler 📌二. 2024-12-26 Python #Python