网站具体流程珠海网站建设易搜互联

张小明 2026/1/11 18:17:57
网站具体流程,珠海网站建设易搜互联,西安有哪些好玩的,重庆市建设项目环境影响评价网站近日#xff0c;小红书首座自用数据中心获得中国数据中心权威协会CDCC的2025年度十大数据优秀项目及国外数据中心媒体 w.media 的 Northeast Asia CloudDatacenter 年度卓悦设计建设奖 Excellence in Data Centre Design and Build.这是国内外目前两个影响力最大的数…近日小红书首座自用数据中心获得中国数据中心权威协会CDCC的2025年度十大数据优秀项目及国外数据中心媒体 w.media 的 Northeast Asia CloudDatacenter 年度卓悦设计建设奖 Excellence in Data Centre Design and Build.这是国内外目前两个影响力最大的数据中心奖项既是对小红书首次交付自用数据中心的重大肯定也是小红书基础技术部实用第一、性价比突出、业内领先技术路线理念的体现。该奖项定位为数据中心全生命周期实践的标杆示范窗口聚焦已落地项目的安全可靠性、绿色节能性与可持续发展能力为行业提供可复制的建设运营范本。This award recognizes excellence in the planning, design, and construction of a new data center facility. Entries will be evaluated on how effectively the project team met or exceeded key objectives while demonstrating innovation in architectural and engineering approaches.本文将梳理小红书数据中心获得两项行业奖项的实践历程系统剖析其获得行业认可的核心设计方案与标准化运营体系。文章整体分成六个部分上云到下云算力结构变化与基础设施策略调整选址云上云下协同视角下的数据中心布局服务器与网络后发优势下的选型与架构实践智算中心设计集中度、预制化与风/液冷兼容智慧运维体系自动化分级与能效优化实践AI绿色算力电力、储能与算电协同探索1. 算力架构多元化发展小红书早期主要是社区和图文内容业务典型的互联网工作负载大部分算力需求可以用几个关键词概括CPU为主的通用计算大量Web/API服务内容生产、分发、基础推荐与搜索标准化数据库与缓存集群在这个阶段全面依赖公有云是非常合理的选择上线快、弹性强可以支撑业务快速增长和频繁试错。但是过去五年情况开始发生了明显变化。随着生成式AI和大模型相关应用的推进我们的算力需求出现了第二条分支方向智能计算GPU支撑模型训练、在线推理、特征处理等AI工作负载智能算力的几个特征值如下单节点功率密度高机柜功率密度高对网络带宽/延迟敏感训练任务持续时间长对稳定性要求高成本压力巨大对TCO敏感2. 自建基础设施势在必行在算力结构变化、电力和GPU等供应链波动以及数据合规和核心业务可控性要求逐渐提高的背景下我们做了一个比较明确的判断“完全依赖公有云不再是长期最优解”对于核心算力小红书做出了构建“自建基础设施 公有云”的混合架构的决定。随后小红书开始系统化推进“下云”自主租用IDC自主规划采买服务器与网络架构在云上云下之间构建统一的资源和调度体系这不是小红书在“去云”而是从“全云化”演进到“云上 自建算力池”的协同形态。下云的第一步是找到一个合适数据中心站点。很多人提到数据中心选址第一反应是土地、电价、气候、政策补贴等。这些对我们同样重要但在做具体规划时我们把“云上云下协同”和“业务连续性”放在更前面。这里可以简单拆成四个维度1. 云上云下协同与容灾我们不把线下数据中心当成一个独立“孤岛”而是从一开始就按混合架构来设计与主流公有云在网络时延上的可接受范围云上云下之间的数据同步方案和带宽预算关键业务在云/线下互为备份、快速切换的可行路径这会反过来影响我们对机房城市/区域乃至运营商的选择。2. 用户体验与网络拓扑我们会结合以下信息用户主要分布区域三大运营商骨干网与节点布局各区域网络时延与跨域传输能力目标不是单点极致而是整体线路可接受、可运维并能支撑未来跨地域多中心的架构演进。3. 成本与政策的长期可信度成本不仅是“今天的电价/地价”还有中长期电价政策与能源可获得性地方对数据中心产业的长期态度变化后续扩容变电、冷源、用地的空间我们会刻意规避那些“短期看起来便宜但未来高度不确定”的选项。4. 自然灾害与区域冗余包括地震带、洪水、极端天气等自然风险跨地域多数据中心的灾备拓扑和故障域拆分总体思路是先从业务视角出发——云上云下混合、网络拓扑、容灾——然后在这个约束空间里再做成本和政策优化而不是纯粹成本驱动。作为数据中心基础设施的“后来者”我们的优势就是可以直接站在行业已有实践之上做选择而不是从0开始摸索。我们的基本原则是不为了“炫技”而采用复杂方案不为了“差异化”而走冷门路线所有选型都要能在业务场景里说清收益1. 服务器三大类型与资源池化我们团队基于各自的职业经验和行业的快速发展在服务器规划上做了一个取舍与其做了非常多的SKU细分或者为了创新而研发不同的机型不如围绕核心场景收敛几类标准机型再通过上层的资源池化来吸收差异。当前推出了三类形态计算型单路面向各类Web服务、API、基础服务组件等单路配置追求性能/成本比和部署密度结合内部调度系统做细粒度分配提高CPU利用率推理型两路 4 GPU面向在线推理 / 实时推荐 / 模型在线服务强调PCIe拓扑合理、网络带宽和延迟可控、支持未来更高功率密度的散热方案这类节点通常需要纳入专门的推理集群调度体系存储型高盘位典型配置60盘位HDD服务于日志、内容存储、Warm/Cold Data等结合分布式存储软件构建统一存储池从运维和成本视角看我们更关心的是集群利用率在调度和中间件层做资源抽象和池化减少业务直接和物理机绑定把“买了多少服务器”转化为“平均利用率是多少”2. 网络POD Super Bank 超高速端口网络侧我们采用的是经过各个大厂验证的多级交换架构CLOS并结合AI集群的特点做了一些规划。核心元素包括Spine–Leaf 架构 POD 化部署每个POD作为基础构建单元内部使用Spine–Leaf方便做模块化扩展和分区部署较好地控制东西向流量和延迟多平面 Super Bank多个POD通过多平面方式组合成更大规模网络减少单Plane故障的整体影响支撑从数千到数万级服务器规模的发展传输速率与介质核心链路采用超300G光模块局部场景短距离、对带宽不敏感配合铜缆以平衡成本整体预留向更高速率演进的空间整体思路是在性能、可扩展性和成本之间找到一个相对平衡点而不是追求单点“极致”。在数据中心的风火水电层面的设计上我们尽量避免“设施定死、未来被动适配”而是从一开始就按AI高功率密度和散热路线的不确定性来预留空间。1. 高集中度IT核心区 环绕式基础设施传统数据中心往往是IT设备与基础设施相对分散分区我们采用的是相对集中化的方式IT包间机柜、AI集群等集中布局在中央核心区配电、制冷、水系统环绕核心区布置这样带来的好处冷量和电力分配更集中能效更好优化水、电、冷的管线更短降低损耗与复杂度运维路径更清晰巡检和应急响应更高效对高功率密度区域可以集中“重点照顾”2. 预制化缩短交付周期提升一致性在新建和扩建项目中我们尽量引入预制化模块包括预制化电力模块含变配电、UPS等预制化制冷模块冷机、冷却塔、分配单元微模块数据中心单元预制化的价值主要体现在三点大部分复杂工作在工厂完成质量更可控现场只做组装和调试交付周期显著缩短模块统一标准后期扩容和维护更可预测对于希望快速上线AI集群或补充算力的场景这种方式非常实用。3. 风冷 液冷不押单一路线提升基础设施的“可变性”AI集群带来的机柜功率密度已经在逼近传统风冷机房的上限但液冷技术路线还在演进中弥漫式风墙冷板混合方案并存。我们的应对策略是从设计阶段就支持风冷 液冷混用可在较大比例区间内调整风冷/液冷比如 5:5 → 1:9在建筑、管道、配电上为液冷留出足够接口和冗余在末端空调上兼容不同形态大风墙、小风墙等适配高低功率密度混合部署这个思路的本质是不赌哪一种散热方案会“胜出”而是让基础设施具备根据业务发展和行业技术演进做调整的能力。数据中心真正的大头在运维周期。我们在这块的目标可以概括为三层把所有基础设施状态“看见”把重复的动作“自动化”在能效和安全约束内“自动调优”1. 自动化分级当前能力在 L2部分场景向 L3 演进我们借用自动驾驶的分级方法来理解运维智能化水平当前整体能力L2部分自动化大量标准事件可以自动识别与处置运维人力集中在复杂故障与策略优化上部分场景开始尝试L3高自动化基于负载预测和气象数据预先调节冷源与机房参数IT包间内机柜电力等能耗数据的实时监控分析 这里对机柜电力等能耗数据的监控分析展开讲一下特别是在机柜超出额定功耗超电的场景下我们的自动化分析策略。结合柜内服务器、网络设备当前的实际使用情况对用电负载进行梳理与评估。包括统计各服务器的数量、型号和功耗参数分析CPU、内存、存储等资源的占用率评估高负载应用或高并发业务对功率的影响初步判断是否存在持续超负载运行导致用电偏高的情况。对柜内整体配电能力和运行状态进行核查。包括检查配电设计是否满足现有服务器规模和冗余要求核对电表与监控数据是否存在偏差对可能存在的线路老化、接触不良、局部过热等隐患进行排查评估是否存在因电气损耗或异常导致的额外功耗。通过以上分析向相关人员和群组推送超电的主要成因并提供后续的整改措施如设备优化、负载调整、配电改造等并提供数据支撑和决策依据。目标是逐步用系统取代高频重复劳动把人释放出来做更有价值的事情。2. DCIM打通“风、火、水、电”的统一监控和分析在基础设施监控系统DCIM上我们选择与专业伙伴联合开发而不是完全从头自研或直接照搬标准产品利用成熟产品能力快速打通风、火、水、电等各系统数据接入再根据小红书的运维流程和组织结构做定制化建立统一模型和告警体系最终目标是形成数据中心的“中枢神经系统”所有关键基础设施都有采集、看板、告警事件可以串起来做关联分析和根因推断为后续自动化与智能调优提供数据基础3. 能效与PUE优化用AI和实时数据“持续调参”能效方面我们不是简单地做一次性改造而是做一个“不断调参数”的过程接入实时气象数据温度、湿度、风速等利用自研算法和AI模型动态调整自然冷与机械冷的切换策略冷水机组、水泵、冷却塔、末端风机的运行参数在保障业务连续性的前提下压低能耗和PUE我们也在尝试把“业务负载曲线”和“能耗曲线”结合起来看有哪些任务可以在能效更高的时间窗口执行为后续算电协同做准备。最后一部分谈一下与AI算力紧密相关的“电力侧”探索这块可能是未来几年变化最大的领域。1. 绿电与自有电源能力未来对于大型AI算力集群电力已经不只是“成本项”而是约束整个体系上限的关键变量。我们的思路可以概括为三点提高绿电占比通过绿电交易、长期合同等路径关注源网荷储一体化的可能性不只是“买电”也要考虑未来一定程度的“自发自用”从发电、输电、用电、储能一体规划提高自洽能力目标不是短期成本最小而是长期电力供给的稳定性和可控性国际上头部互联网大厂等已经在探索自建发电站含核能/火电等我们跟业内同仁认同一个判断未来AI竞争的一条底层分界线在于谁能更高效地获得大规模电力。2. 储能把“电”的时间维度拉长储能技术是电力与算力之间的关键缓冲层也是我们重点关注的方向之一化学储能锂电、钠电等机械储能飞轮等势能储能抽水蓄能等我们不会自己做底层技术研发而是重点跟踪行业成熟方案把它们与数据中心负载特性结合与电价峰谷、用电政策结合用来平滑电力波峰/波谷支撑高功率AI任务执行储能对数据中心的意义不是简单“备用电源”而是可以将算力消耗从电力高峰“平移”出来为后面的算电协同打基础。3. 算电协同让算力任务和电价/电网状况“对齐”最后一块是算力和电力的联动调度问题。我们正在探索这样一些方向把算力任务按“实时性/可延期性/优先级”做分级利用电价信号、电网负荷信息把可延迟任务下沉到低电价/低负荷时段对跨地域的算力集群考虑不同区域电价差异和用电政策差异做整体调度简单说就是即时业务如在线推理优先保障体验和稳定可延迟的大模型训练等任务尽量“追着低价电、低压电网”跑长期看这块会是AI基础设施的重要优化空间。小红书的数据中心和AI基础设施建设还在快速演进中从全云到混合架构从单一风冷到风/液冷兼容从传统机房运维到更高水平的自动化从强调单站点的能效PUE优化到数据中心间的算电协同这中间有很多工程上的权衡和取舍。我们没有把自己当成“行业范本”更多是希望把一些真实的实践过程和决策逻辑分享出来供大家参考在选址、机电设计、AI集群网络等方面的经验和坑在DCIM、运维自动化、能效优化上的工具和方法在绿电、储能、算电协同上的探索与试错也期待后续有更多机会和同行深入沟通互相借鉴共同推动数据中心和AI基础设施的整体发展。来源小红书技术REDtech
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

免费app制作网站新媒体运营培训

TensorFlow中tf.tile与tf.repeat张量扩展技巧 在深度学习的实际开发中,我们经常需要对张量进行形状变换和数据复制。尤其是在构建复杂模型结构或处理不规则输入时,如何高效、准确地“拉伸”或“复制”数据,直接关系到模型的性能与可维护性。 …

张小明 2026/1/5 0:17:51 网站建设

保险做的好的网站有哪些WordPress寻主题

如何快速批量生成桌游卡牌:CardEditor终极使用指南 【免费下载链接】CardEditor 一款专为桌游设计师开发的批处理数值填入卡牌生成器/A card batch generator specially developed for board game designers 项目地址: https://gitcode.com/gh_mirrors/ca/CardEdi…

张小明 2026/1/8 20:19:21 网站建设

虚拟货币做空网站中国关于影院建设的网站

做抖音、小红书、视频号这类高风控平台运营,每天都在 “踩雷边缘” 试探 —— 多账号共用 IP 被批量限流,私信漏看错失变现机会,逆向方案突然失效导致账号登不上,甚至辛苦运营的账号直接被封。而同类工具只做基础账号管理&#xf…

张小明 2026/1/5 6:35:46 网站建设

淄博网站开发个人网站可以做淘宝店铺名

💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 目录Node.js开发者的自我修养:从"Hello World"到"救命!为什么又卡住了?"…

张小明 2026/1/7 5:37:02 网站建设

网站下载视频的方法做响应式网站字体需要响应么

iNSFC LaTeX模板终极指南:快速掌握科研申请高效工具 【免费下载链接】iNSFC An awesome LaTeX template for NSFC proposal. 项目地址: https://gitcode.com/gh_mirrors/in/iNSFC 想要快速撰写符合国家自然科学基金要求的申请书吗?iNSFC LaTeX模板…

张小明 2026/1/8 6:27:04 网站建设