云原生 AI 工程化实践之 FasterTransformer 加速 LLM 推理

01 背景 OpenAI 在 3 月 15 日发布了备受瞩目的 GPT4,它在司法考试和程序编程领域的惊人表现让大家对大语言模型的热情达到了顶点。人们纷纷议论我们是否已经跨入通用人工智能的时代。与此同...

昨天 17:26
174
0
TMC Self-Managed 提升跨多云环境安全性

作为云原生技术栈的关键技术之一,Kubernetes 被企业用户广泛试用并开始支撑实际业务应用运行,实现技术先进性带来的生产力提升。但与此同时,随着 Kubernetes 技术的不断广泛与深化使用,企...

昨天 17:08
96
0
实录分享 | 使用Prometheus和Grafana监控Alluxio运行状况

欢迎来到【微直播间】,2min纵览大咖观点 本次分享主要包括三个方面: Prometheus&Grafana简介 环境搭建 手动调优 一、 Prometheus&Grafana简介 关于Prometheus: Prometheus 是一个开源的完...

昨天 16:22
182
0
MySQL 8.0.34 在密码管理上的改进

本文作者详细说明了 MySQL 8.0.34 版本在密码管理上的改进。 作者:Sri Sakthivel 本文来源:Percona 官网博客 爱可生开源社区出品。 MySQL 8.0.34为我们带来了新的密码验证参数 validate_p...

昨天 15:58
468
0
GaussDB技术解读系列之应用无损透明(ALT)

本文作者 :华为云GaussDB研发高级工程师 藏琦 1.背景 GaussDB作为一款企业级分布式数据库,提供了“同城跨AZ双活、两地三中心、双集群强一致”等极致的高可用容灾能力。当某个数据库节点由于...

昨天 15:38
75
0
数仓中典型的几种不下推语句整改案例

本文分享自华为云社区《GaussDB(DWS)性能调优:典型不下推语句整改案例》,作者: 譡里个檔 。 场景1:With-Recursive contains only values rte is not shippable 根因:递归语句的某个分支...

昨天 14:52
208
0
聊聊数据库中的 savepoint

从全局二级索引讲起 故事要从全局二级索引开始讲起。 当我们构建了一个全局二级索引之后,一条逻辑上的数据插入,就会变成两条物理上的数据插入:一条插入到主表,另一条插入到索引表。为了保...

昨天 14:31
199
0
PolarDB-X 针对跑批场景的思考和实践

背景 金融行业和运营商系统,业务除了在线联机查询外,同时有离线跑批处理,跑批场景比较注重吞吐量,同时基于数据库场景有一定的使用惯性,比如直连MySQL分库分表的存储节点做本地化跑批、以...

昨天 14:18
98
0
Spring 中 @Qualifier 注解还能这么用?

@[toc] 今天想和小伙伴们聊一聊 @Qualifier 注解的完整用法,同时也顺便分析一下它的实现原理。 说到 @Qualifier,有的小伙伴可能会觉得诧异,这也只得写一篇文章?确实,但凡有点开发经验,...

昨天 11:16
1.7K
0
Apache Doris 2.0.0 版本正式发布:盲测性能 10 倍提升,更统一多样的极速分析体验

亲爱的社区小伙伴们,我们很高兴地向大家宣布,Apache Doris 2.0.0 版本已于 2023 年 8 月 11 日正式发布,有超过 275 位贡献者为 Apache Doris 提交了超过 4100 个优化与修复。 在 2.0.0 版...

昨天 11:11
210
0
为什么MySQL单表不能超过2000万行?

最近看到一篇《我说MySQL每张表最好不要超过2000万数据,面试官让我回去等通知》的文章,非常有趣。 文中提到,他朋友在面试的过程中说,自己的工作就是把用户操作信息存到MySQL里,因为数据...

昨天 10:49
2.2K
0
Log4j疯狂写日志问题排查 | 京东云技术团队

一、问题是怎么发现的 最近有个Java系统上线后不久就收到了磁盘使用率告警,磁盘使用率已经超过了90%以上,并且磁盘使用率还在不停增长。 二、问题带来的影响 由于服务器磁盘被打满,导致了系...

昨天 10:42
381
0
你们的优雅停机真的优雅吗? | 京东云技术团队

1.前言 emm,又又遇到问题啦,现有业务系统应用上线存在窗口期,不能满足正常任务迭代上线。在非窗口期上线容易导致数据库、mq、jsf等线程中断,进而导致需要手动修单问题。故而通过添加优雅...

昨天 10:28
849
1
JDK 17 营销初体验 —— 亚毫秒停顿 ZGC 落地实践 | 京东云技术团队

前言 自 2014 年发布以来, JDK 8 一直都是相当热门的 JDK 版本。其原因就是对底层数据结构、JVM 性能以及开发体验做了重大升级,得到了开发人员的认可。但距离 JDK 8 发布已经过去了 9 年,...

昨天 10:00
2.1K
1
JaCoCo助您毁灭线上僵尸代码 | 京东物流技术团队

一. 现状·问题 随着需求不断迭代,业务系统的业务代码突飞猛进,在你自豪于自己的代码量产出很高时,有没有回头看看线上真正的客户使用量又有多少呢? ~费事费力耗费大量人力成本~上线的功能...

昨天 09:47
1K
0
技术分享 | kill掉mysqld_safe进程会影响mysqld进程?

1、背景 公司内部看到一则问题 1、kill -9 mysqld_safe 进程 2、systemd 检测到 mysqld_safe 进程不存在后,重新拉起 mysqld_safe 进程 3、mysqld_safe 进程启动后,发现 mysqld 进程也被重启...

昨天 09:39
313
0
极简工作流「GitHub 热点速览」

原以为 LLM 很难,但其实可以很简单,比如 Flowise 拖拽拖拽就能出来一个 LLM 流程,非常简单你的 LLM 就可以 run 起来了。同样的 web-check 也能极快速地帮你解决 Web 安全那些事,什么 DN...

昨天 08:39
1.2K
0
vivo 场景下的 H5无障碍适配实践

作者:vivo 互联网前端团队- Zhang Li、Dai Wenkuan 随着信息无障碍的建设越来越受重视,开发人员在无障碍适配中也遇到了越来越多的挑战。本文是笔者在vivo开发H5项目做无障碍适配的实践总结...

08/09 20:59
639
1
大模型时代的程序员:不会用AIGC编程,未来5年将被淘汰?

作者 | 郭炜 策划 | 凌敏 前言 下面是一段利用 Co-Pilot 辅助开发的小视频,这是 Apache SeaTunnel 开发者日常开发流程中的一小部分。如果你还没有用过 Co-Pilot、ChatGPT 或者私有化大模型帮...

08/11 18:23
3.4K
0
RDMA在典型场景下的技术应用分析与探索

当前OPPO的数据中心中已经有一定数量支持RDMA的网卡(包含IB及ROCEv2),除了机器学习场景以外,之前的文章ORPC[1] 也已经分享了OPPO在RPC over RDMA传输的实践,具体RDMA相关前置知识也可以...

08/09 20:00
2.7K
1
返回顶部
顶部