Deepindeed

ONNX:最流行的模型 IR

发表于 2022-12-15 更新于 2022-12-17 分类于 blog 评论数：本文字数： 17k 阅读时长 ≈ 28 分钟

ONNX 作为当下深度学习框架中最流行的中间表达方式，社区活跃。即使当下性能最佳的 TensorRT 早已支持 ONNX Parser，逐渐摒弃 CaffeParser，倒底这种 IR 有什么魔力？今天我们来一探究竟。

发表于 2022-11-13 更新于 2022-12-18 分类于 blog 评论数：本文字数： 20k 阅读时长 ≈ 33 分钟

关于OnnxRuntime推理框架的介绍到框架的源码剖析以及项目中使用onnxruntime部署遇到的问题总结

发表于 2022-10-10 更新于 2022-12-14 分类于 blog 评论数：本文字数： 1.9k 阅读时长 ≈ 3 分钟

AI算法服务部署中常识问答总结

发表于 2022-10-10 更新于 2022-11-17 分类于 blog 评论数：本文字数： 6.1k 阅读时长 ≈ 10 分钟

关于应用FasterTransformer部署Transformer模型的经验总结与原理解读

发表于 2022-08-31 更新于 2022-11-17 分类于 blog 评论数：本文字数： 7.3k 阅读时长 ≈ 12 分钟

笔者关于CUDA并行编程学习中的记录

发表于 2022-08-03 更新于 2022-12-18 分类于 blog 评论数：本文字数： 12k 阅读时长 ≈ 21 分钟

近日，PyTorch 发布了1.12 版本，其中针对 Torchscript 部署优化做了一些改进, 并引入了 nvFuser，我们来一起看看吧。

发表于 2022-03-10 更新于 2022-11-17 分类于 paper 评论数：本文字数： 7.6k 阅读时长 ≈ 13 分钟

NLP 文本场景的数据优化

发表于 2022-03-04 更新于 2022-11-17 分类于 paper 评论数：本文字数： 5.2k 阅读时长 ≈ 9 分钟

Label Noise Learning

发表于 2021-07-23 更新于 2022-11-17 分类于 paper 评论数：本文字数： 6.2k 阅读时长 ≈ 10 分钟

中文文本纠错

发表于 2020-04-07 更新于 2022-11-16 分类于 blog 评论数：本文字数： 4.1k 阅读时长 ≈ 7 分钟

如果不了解编译器对我们的C++代码做了什么手脚，很多困惑永远都解不开。