一文读懂大数据各组件 在还没接触大数据的时候,着实被那么多技术组件和平台架构吓到了,以下列举一些 Druid、Kudu、ClickHouse、Flink、Spark 、Storm、Impala、Presto、Hive、Kafka、RabbitMQ、Canal、Doris、Apache Airflow、Oozie、Azkaban、DolphinScheduler、HDFS、YARN、MapReduce、Hive、HBas 2024-12-26 大数据 #大数据
python爬取指定微博用户并基于微博内容生成词云图 😄程序用途 该程序用来对感兴趣的微博博主进行分析,根据微博内容生成词云图,效果如下: 📌一.爬取指定博主的微博内容 爬虫部分主要利用Requests包爬取相应的信息,感兴趣大家可以自行阅读代码,这里主要介绍词云的生成,就不展开说爬虫程序了~ 爬虫全部代码:https://github.com/YUTING0907/pythonTools/tree/main/WeiboCrawler 📌二. 2024-12-26 Python #Python
Python解析英文电子书并提供词频统计和单词解释 程序用途最近看英文原版电子书有点苦恼,很多单词联系上下文能懂个大概意思,不影响整体的阅读,但是看完之后又想巩固学习下陌生的单词。于是乎,就想的是能不能用python写个程序把单词根据单词等级(common,advanced)统计出现的频率并解释单词的意思,所以就有了这篇文章啦~ 1.下载单词书首先下载好英文书,这里分享一个免费下载电子书的网站https://zh.z-lib.gs/ 以最近喜欢的N 2024-12-26 Python #Python
JAVA设计模式 面向对象特性:封装、抽象、继承、多态 接口和抽象类的区别? 接口是has-a,抽象类是is-a,接口倾向于丰富功能不是从属关系。 实际工作中应该培养思维: 基于接口而非实现编程,如函数的命名不能暴露任何实现细节,封装具体的实现细节,特殊的流程不应该暴露给调用者。 多用组合少用继承,委托和组合可以实现代码复用,委托为接口的一个实现类。 面向对象编程的思考过程 划分职责进而识别出有哪些类; 根据 2024-12-05 Java #JAVA
将深度学习代码同时运行在多个GPU显卡上 将深度学习代码同时运行在多个GPU显卡上步骤1设置os.environ[‘CUDA_VISIBLE_DEVICES’] 指定GPU 1234567# 将import torch放在os.environ['CUDA_VISIBLE_DEVICES'] = '0,1'后面import osos.environ['CUDA_VISIBLE_DEVICES 2024-11-06 #Deep Learning
pytorch加载模型torch.load()遇到问题ModuleNotFoundError: No module named models 问题描述: 在加载自己训练的模型文件时,报错ModuleNotFoundError: No module named ‘models’。 123import torchmodel_tmp = torch.load('./yolov5s.pt')print(model_tmp) 问题分析:写load的这个文件要放到具有yolov5工程的文件夹里运行,因为它会寻找原生yolo5工 2024-11-05 #Deep Learning
数据服务实践 构建API集市,实现接口复用为了实现接口的复用,我们需要构建 API 的集市,应用开发者可以直接在 API 集市发现已有的数据接口,直接申请该接口的 API 权限,即可访问该数据,不需要重复开发 操作流程 步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,需先将您的数据库或数据仓库添加为DataWorks数据源,以此作为数据服务API的数据来源。开发数据服务API时,数据服务将访问该数 2024-06-14 大数据 #JAVA
基于GitLab-DolphinScheduler的SQL审核CI/CD实践 背景数据开发在基于DolphinScheduler调度平台进行sql开发,对于需求的迭代和变更,需要在DolphinScheduler上进行sql的变更,但是在DolphinScheduler仅有的是对于sql task任务节点的修改记录的不同版本,只能进行版本的切换,对于sql文件的版本管控缺乏如git对文件变更的直观变化记录。 工作流Developer -> 在Dolpin上创建工作流& 2024-06-14 大数据 #Java #DolphinScheduler
Theme-Aware Aesthetic Distribution Prediction With Full-Resolution Photographs 该论文发表在IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL.XX, NO.XX, JANUARY, 2021,CCF B评级 1.Introducation为了解决统一的输入尺寸约束和真实世界图像的不同尺寸之间的冲突, 本文通过在以填充图像为输入的网络中应用RoM池化,开发了一种名为PRP的新方法。 1.这种方法使我们能 2023-09-19 论文阅读 #CV - image aesthetics