数据科学最佳实践:Kedro 的工程化解决方案 | 开源日报 No.47

本文主要是介绍数据科学最佳实践:Kedro 的工程化解决方案 | 开源日报 No.47,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

leonardomso/33-js-concepts

Stars: 58.4k License: MIT

这个项目是一个帮助开发者掌握 JavaScript 概念的资源库。该项目基于 Stephen Curtis 撰写的一篇文章,包含了对 33 个重要 JavaScript 概念全面深入地讲解,并被 GitHub 评为 2018 年最佳开源项目之一。

denysdovhan/wtfjs

Stars: 32.1k License: WTFPL

这个项目是一个有趣的 JavaScript 示例列表,主要功能是收集一些棘手的例子并解释它们如何工作。该项目可以帮助初学者更深入地了解 JavaScript,并为专业开发人员提供参考。核心优势和关键特点包括:

  • 收集有趣且棘手的 JavaScript 示例
  • 解释每个示例背后的原理和逻辑
  • 提供对 ECMAScript 规范中相关部分链接以便进一步阅读

TheAlgorithms/JavaScript

Stars: 28.4k License: GPL-3.0

这个项目是 TheAlgorithms 的 JavaScript 仓库,使用 JavaScript 实现了各种算法和数据结构。

kedro-org/kedro

Stars: 8.8k License: Apache-2.0

Kedro 是一个用于生产级数据科学的工具箱。它使用软件工程最佳实践,帮助您创建可重现、可维护和模块化的数据工程和数据科学流水线。主要功能包括:

  • 项目模板:基于 Cookiecutter Data Science 的标准、可修改且易于使用的项目模板。
  • 数据目录:一系列轻量级数据连接器,用于在许多不同文件格式和文件系统 (包括本地文件系统、网络文件系统、云对象存储和 HDFS) 之间保存和加载数据,并提供针对基于文件的系统进行版本控制。
  • 流水线抽象:自动解析纯 Python 函数之间的依赖关系,并通过 Kedro-Viz 进行流水线可视化。
  • 编码规范:采用 pytest 进行测试驱动开发,在 Sphinx 中生成文档良好注释代码,支持 flake8isortblack,并利用标准 Python 日志库编写经过 lint 处理后的代码。
  • 灵活部署:支持单机或分布式部署策略,同时还额外支持在 Argo,Prefect,Kubeflow,AWS Batch and Databricks 上部署。

4ian/GDevelop

Stars: 5.2k License: NOASSERTION

GDevelop 是一个全功能的、无代码的开源游戏开发软件。

  • GDevelop 具有完整功能
  • 无需编码即可创建游戏
  • 可用于移动设备、桌面和 Web 平台
  • 基于直观而强大的基于事件系统构建游戏逻辑

SoftFever/OrcaSlicer

Stars: 2.1k License: AGPL-3.0

Orca Slicer 是一款开源的 FDM 打印机切片软件。具有以下核心优势和特点:

  • 自动校准
  • 三明治模式
  • 精确壁厚
  • Klipper 支持

这篇关于数据科学最佳实践:Kedro 的工程化解决方案 | 开源日报 No.47的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/156198

相关文章

使用Python开发一个Ditto剪贴板数据导出工具

《使用Python开发一个Ditto剪贴板数据导出工具》在日常工作中,我们经常需要处理大量的剪贴板数据,下面将介绍如何使用Python的wxPython库开发一个图形化工具,实现从Ditto数据库中读... 目录前言运行结果项目需求分析技术选型核心功能实现1. Ditto数据库结构分析2. 数据库自动定位3

pandas数据的合并concat()和merge()方式

《pandas数据的合并concat()和merge()方式》Pandas中concat沿轴合并数据框(行或列),merge基于键连接(内/外/左/右),concat用于纵向或横向拼接,merge用于... 目录concat() 轴向连接合并(1) join='outer',axis=0(2)join='o

批量导入txt数据到的redis过程

《批量导入txt数据到的redis过程》用户通过将Redis命令逐行写入txt文件,利用管道模式运行客户端,成功执行批量删除以Product*匹配的Key操作,提高了数据清理效率... 目录批量导入txt数据到Redisjs把redis命令按一条 一行写到txt中管道命令运行redis客户端成功了批量删除k

Spring Boot集成/输出/日志级别控制/持久化开发实践

《SpringBoot集成/输出/日志级别控制/持久化开发实践》SpringBoot默认集成Logback,支持灵活日志级别配置(INFO/DEBUG等),输出包含时间戳、级别、类名等信息,并可通过... 目录一、日志概述1.1、Spring Boot日志简介1.2、日志框架与默认配置1.3、日志的核心作用

破茧 JDBC:MyBatis 在 Spring Boot 中的轻量实践指南

《破茧JDBC:MyBatis在SpringBoot中的轻量实践指南》MyBatis是持久层框架,简化JDBC开发,通过接口+XML/注解实现数据访问,动态代理生成实现类,支持增删改查及参数... 目录一、什么是 MyBATis二、 MyBatis 入门2.1、创建项目2.2、配置数据库连接字符串2.3、入

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

使用Python构建智能BAT文件生成器的完美解决方案

《使用Python构建智能BAT文件生成器的完美解决方案》这篇文章主要为大家详细介绍了如何使用wxPython构建一个智能的BAT文件生成器,它不仅能够为Python脚本生成启动脚本,还提供了完整的文... 目录引言运行效果图项目背景与需求分析核心需求技术选型核心功能实现1. 数据库设计2. 界面布局设计3

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

Android Paging 分页加载库使用实践

《AndroidPaging分页加载库使用实践》AndroidPaging库是Jetpack组件的一部分,它提供了一套完整的解决方案来处理大型数据集的分页加载,本文将深入探讨Paging库... 目录前言一、Paging 库概述二、Paging 3 核心组件1. PagingSource2. Pager3.

Java.lang.InterruptedException被中止异常的原因及解决方案

《Java.lang.InterruptedException被中止异常的原因及解决方案》Java.lang.InterruptedException是线程被中断时抛出的异常,用于协作停止执行,常见于... 目录报错问题报错原因解决方法Java.lang.InterruptedException 是 Jav