[導讀]前言這篇文章的主題是記錄一次Python程序的性能優(yōu)化,在優(yōu)化的過程中遇到的問題,以及如何去解決的。為大家提供一個優(yōu)化的思路,首先要聲明的一點是,我的方式不是唯一的,大家在性能優(yōu)化之路上遇到的問題都絕對不止一個解決方案。如何優(yōu)化首先大家要明確的一點是,脫離需求談優(yōu)化都是耍流氓,所...
前言
這篇文章的主題是記錄一次 Python 程序的性能優(yōu)化,在優(yōu)化的過程中遇到的問題,以及如何去解決的。為大家提供一個優(yōu)化的思路,首先要聲明的一點是,我的方式不是唯一的,大家在性能優(yōu)化之路上遇到的問題都絕對不止一個解決方案。
如何優(yōu)化
首先大家要明確的一點是,脫離需求談優(yōu)化都是耍流氓,所以有誰跟你說在xx機器上實現(xiàn)了百萬并發(fā),基本上可以認為是不懂裝懂了,單純的并發(fā)數(shù)完全是無意義的。其次,我們優(yōu)化之前必須要有一個目標,需要優(yōu)化到什么程度,沒有明確目標的優(yōu)化是不可控的。再然后,我們必須明確的找出性能瓶頸在哪里,而不能漫無目的的一通亂搞。
需求描述
這個項目是我在上家公司負責一個單獨的模塊,本來是集成在主站代碼中的,后來因為并發(fā)太大,為了防止出現(xiàn)問題后拖累主站服務,所有由我一個人負責拆分出來。對這個模塊的拆分要求是,壓力測試 QPS 不能低于3萬,數(shù)據(jù)庫負載不能超過50%,服務器負載不能超過70%,單次請求時長不能超過70ms,錯誤率不能超過5%。環(huán)境的配置如下:服務器:4核8G內(nèi)存,CentOS7系統(tǒng),SSD 硬盤
數(shù)據(jù)庫:MySQL 5.7,最大連接數(shù) 800
緩存: Redis,1G 容量。以上環(huán)境都是購買自騰訊云的服務。壓測工具:locust,使用騰訊的彈性伸縮實現(xiàn)分布式的壓測。需求描述如下:用戶進入首頁,從數(shù)據(jù)庫中查詢是否有合適的彈窗配置,如果沒有,則繼續(xù)等待下一次請求、如果有合適的配置,則返回給前端。這里開始則有多個條件分支,如果用戶點擊了彈窗,則記錄用戶點擊,并且在配置的時間內(nèi)不再返回配置,如果用戶未點擊,則24小時后繼續(xù)返回本次配置,如果用戶點擊了,但是后續(xù)沒有配置了,則接著等待下一次。
重點分析
根據(jù)需求,我們知道了有幾個重要的點,1、需要找出合適用戶的彈窗配置,2、需要記錄用戶下一次返回配置的時間并記錄到數(shù)據(jù)庫中,3、需要記錄用戶對返回的配置執(zhí)行了什么操作并記錄到數(shù)據(jù)庫中。
調(diào)優(yōu)
我們可以看到,上述三個重點都存在數(shù)據(jù)庫的操作,不只有讀庫,還有寫庫操作。從這里我們可以看到如果不加緩存的話,所有的請求都壓到數(shù)據(jù)庫,勢必會占滿全部連接數(shù),出現(xiàn)拒絕訪問的錯誤,同時因為 SQL 執(zhí)行過慢,導致請求無法及時返回。所以,我們首先要做的就是講寫庫操作剝離開來,提升每一次請求響應速度,優(yōu)化數(shù)據(jù)庫連接。整個系統(tǒng)的架構圖如下:
將寫庫操作放到一個先進先出的消息隊列中來做,為了減少復雜度,使用了Redis 的 list 來做這個消息隊列。然后進行壓測,結果如下:QPS 在 6000 左右 502 錯誤大幅上升至 30%,服務器 CPU 在 60%-70% 之間來回跳動,數(shù)據(jù)庫連接數(shù)被占滿 TCP 連接數(shù)為 6000 左右,很明顯,問題還是出在數(shù)據(jù)庫,經(jīng)過排查 SQL 語句,查詢到原因就是找出合適用戶的配置操作時每次請求都要讀取數(shù)據(jù)庫所導致的連接數(shù)被用完。因為我們的連接數(shù)只有 800,一旦請求過多,勢必會導致數(shù)據(jù)庫瓶頸。好了,問題找到了,我們繼續(xù)優(yōu)化,更新的架構如下:
我們將全部的配置都加載到緩存中,只有在緩存中沒有配置的時候才會去讀取數(shù)據(jù)庫。接下來我們再次壓測,結果如下:
QPS 壓到 2萬左右的時候就上不去了,服務器 CPU 在 60%-80% 之間跳動,數(shù)據(jù)庫連接數(shù)為300個左右,每秒TPC連接數(shù)為1.5萬左右。這個問題是困擾我比較久的一個問題,因為我們可以看到,我們2萬的 QPS,但是TCP 連接數(shù)卻并沒有達到2萬,我猜測,TCP連接數(shù)就是引發(fā)瓶頸的問題,但是因為什么原因所引發(fā)的暫時無法找出來。
這個時候猜測,既然是無法建立 TCP 連接,是否有可能是服務器限制了 socket 連接數(shù),驗證猜測,我們看一下,在終端輸入 ulimit -n 命令,顯示的結果為65535,看到這里,覺得 socket 連接數(shù)并不是限制我們的原因,為了驗證猜測,將 socket 連接數(shù)調(diào)大為100001.再次進行壓測,結果如下:QPS壓到2.2萬左右的時候就上不去了,服務器cpu在60%-80%之間跳動,數(shù)據(jù)庫連接數(shù)為300個左右,每秒 TCP 連接數(shù)為1.7萬左右。雖然有一點提升,但是并沒有實質性的變化,接下來的幾天時間,我發(fā)現(xiàn)都無法找到優(yōu)化的方案,那幾天確實很難受,找不出來優(yōu)化的方案,過了幾天,再次將問題梳理了一遍,發(fā)現(xiàn),雖然socket連接數(shù)足夠,但是并沒有全部被用上,猜測,每次請求過后,tcp連接并沒有立即被釋放,導致socket無法重用。經(jīng)過查找資料,找到了問題所在,
TCP 鏈接在經(jīng)過四次握手結束連接后并不會立即釋放,而是處于 timewait 狀態(tài),會等待一段時間,以防止客戶端后續(xù)的數(shù)據(jù)未被接收。
好了,問題找到了,我們要接著優(yōu)化,首先想到的就是調(diào)整 TCP 鏈接結束后等待時間,但是 Linux 并沒有提供這一內(nèi)核參數(shù)的調(diào)整,如果要改,必須要自己重新編譯內(nèi)核,幸好還有另一個參數(shù) net.ipv4.tcp_max_tw_buckets, timewait 的數(shù)量,默認是180000。我們調(diào)整為 6000,然后打開 timewait 快速回收,和開啟重用,完整的參數(shù)優(yōu)化如下:
#timewait 的數(shù)量,默認是 180000。net.ipv4.tcp_max_tw_buckets = 6000
net.ipv4.ip_local_port_range = 1024 65000
#啟用 timewait 快速回收。net.ipv4.tcp_tw_recycle = 1#開啟重用。允許將 TIME-WAIT sockets 重新用于新的 TCP 連接。net.ipv4.tcp_tw_reuse = 1 我們再次壓測,結果顯示:QPS 5萬,服務器 CPU 70%,數(shù)據(jù)庫連接正常,TCP 連接正常,響應時間平均為 60ms,錯誤率為 0%。
結語
到此為止,整個服務的開發(fā)、調(diào)優(yōu)、和壓測就結束了?;仡欉@一次調(diào)優(yōu),得到了很多經(jīng)驗,最重要的是,深刻理解了web開發(fā)不是一個獨立的個體,而是網(wǎng)絡、數(shù)據(jù)庫、編程語言、操作系統(tǒng)等多門學科結合的工程實踐,這就要求web開發(fā)人員有牢固的基礎知識,否則出現(xiàn)了問題還不知道怎么分析查找。ps:服務端開啟了 tcp_tw_recycle 和 tcp_tw_reuse是會導致一些問題的,我們?yōu)榱藘?yōu)化選擇犧牲了一部分,獲得另一部分,這也是我們要明確的,具體的問題可以查看耗子叔的文章TCP 的那些事兒(上)
本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
中國鄭州2025年9月5日 /美通社/ --?全球領先的電動客車制造商宇通客車("宇通",上交所代碼:600066)全新升級的車聯(lián)網(wǎng)系統(tǒng)Link+采用先進技術實現(xiàn)車隊車輛與管理平臺的智能互聯(lián)。作為Vehicle+升級版,...
關鍵字:
LINK
車聯(lián)網(wǎng)
AI
PS
超高功率密度AI電源模塊MPC24380破解算力升級的能源與散熱難題 上海2025年8月27日 /美通社/ -- 8月26日,elexcon2025-第22屆深圳國際電子展正式拉開帷幕。為了表彰在"AI與雙碳"雙線技術...
關鍵字:
電子
AI芯片
PS
BSP
在工業(yè)自動化領域,Modbus協(xié)議憑借其開放性和易用性成為設備通信的"通用語言"。然而,當工程師面對Modbus RTU、ASCII和TCP三種變體時,如何根據(jù)具體場景做出最優(yōu)選擇?本文將從編碼機制、通信效率、錯誤檢測等...
關鍵字:
Modbus協(xié)議
TCP
北京2025年8月20日 /美通社/ -- 全球領先的市場研究公司之一益普索Ipsos,宣布與斯坦福大學政治與社會變革實驗室(PASCL)達成開創(chuàng)性合作,共同探索人工智能(AI)與合成數(shù)據(jù)在市場與消費者研究中的創(chuàng)新應用。...
關鍵字:
斯坦福
人工智能
PS
OS
北京——2025年8月15日,亞馬遜云科技日前宣布,Amazon DocumentDB Serverless已正式可用,這是Amazon DocumentDB(兼容MongoDB)的一種全新配置,能夠根據(jù)應用程序需求自動...
關鍵字:
數(shù)據(jù)庫
服務器
濟南2025年8月12日 /美通社/ -- 近年來,國家大力推進信創(chuàng)產(chǎn)業(yè)發(fā)展,明確要求關鍵行業(yè)信息系統(tǒng)實現(xiàn) "自主可控、安全可靠",老年教育領域作為民生服務的重要陣地,其信息化建設的國產(chǎn)化適配已成為行...
關鍵字:
全棧
BSP
數(shù)據(jù)庫
加密
-DXC助力Northeast Grocery實現(xiàn)數(shù)字化轉型,為其節(jié)省4000萬美元 DXC為Northeast Grocery簡化了復雜流程,并加速了其創(chuàng)新路線圖 弗吉尼亞州阿什本2025年8月12日 /美通社/...
關鍵字:
數(shù)字化
EAST
PS
TOP
8月14日消息,據(jù)媒體報道,索尼首席財務官Hiroki Totoki在2025財年第一季度財報電話會議上宣布,為應對美國關稅影響,公司已對PlayStation 5(PS5)供應鏈進行了戰(zhàn)略調(diào)整。
關鍵字:
索尼
PS
汽車12V系統(tǒng)到汽車48V系統(tǒng)全適用 上海2025年8月11日 /美通社/ --?MPS芯源系統(tǒng)(NASDAQ代碼:MPWR)近日發(fā)布的新產(chǎn)品MPQ6539-AEC1,是一款專為三相無刷直流(BLDC)電機驅動器而設計...
關鍵字:
柵極驅動器
驅動器IC
PS
QFN
在云計算與數(shù)據(jù)庫高可用場景中,LVM(Logical Volume Manager)的動態(tài)擴展能力已成為保障業(yè)務連續(xù)性的關鍵技術。某金融企業(yè)通過LVM在線擴容將數(shù)據(jù)庫停機時間從2小時縮短至30秒,但操作不當仍可能導致數(shù)據(jù)...
關鍵字:
LVM
數(shù)據(jù)庫
—這款廣受歡迎的低語聲護士型安卓機器人的聲庫將于7月16日起,在VOCALOID官方商店發(fā)售 日本濱松市 2025年7月16日 /美通社/ --?雅馬哈公司宣布,該公司將于7月16日正式發(fā)布面向VOCALOID(...
關鍵字:
AI
BSP
PS
機器人
TCP/IP(Transmission Control Protocol/Internet Protocol,傳輸控制協(xié)議/網(wǎng)際協(xié)議)是指能夠在多個不同網(wǎng)絡間實現(xiàn)信息傳輸?shù)膮f(xié)議簇。TCP/IP協(xié)議不僅僅指的是TCP 和I...
關鍵字:
TCP
IP
上海 2025年7月14日 /美通社/ -- MPS芯源系統(tǒng)(NASDAQ代碼:MPWR)近日發(fā)布的MP2764是新一代高集成度、高效率、帶NVDC路徑管理的升降壓充電管理芯片,專為筆記本電腦、平板電腦、游戲掌機等應用...
關鍵字:
充電IC
筆記本電腦
PS
電感
北京 2025年7月10日 /美通社/ -- 全球向量數(shù)據(jù)庫的先行者Zilliz利用亞馬遜云科技的生成式AI技術與云服務,為全球企業(yè)及開發(fā)者提供高可擴展、安全穩(wěn)定的向量數(shù)據(jù)庫解決方案,助力企業(yè)全面釋放數(shù)據(jù)潛能。此外,依...
關鍵字:
亞馬遜
向量
數(shù)據(jù)庫
AI
北京 2025年7月3日 /美通社/ -- 近日,北京積算科技有限公司(以下簡稱"積算科技")正式推出GPU裸金屬算力服務套件,幫助客戶實現(xiàn)并行環(huán)境的分鐘級部署與出廠級性能校準,在GPU裸金屬算力上...
關鍵字:
金屬
GPU
性能優(yōu)化
操作系統(tǒng)
n8n是一個連接API、數(shù)據(jù)庫和服務的開源工作流自動化平臺。實際上,它允許非程序員使用可視化界面構建復雜的系統(tǒng),同時為開發(fā)人員提供強大且可擴展的自動化設計方法。它是部署AI代理、結合觸發(fā)器、語言模型(llm)和外部工具的...
關鍵字:
n8n
API
數(shù)據(jù)庫
ESP32
上海 2025年6月20日 /美通社/ -- 在2025亞馬遜云科技中國峰會上,全球知名的汽車制造商長城汽車宣布應用亞馬遜云科技Amazon Connect構建全球聯(lián)絡中心,實現(xiàn)了全球客服從統(tǒng)一渠道、客戶投訴分級與跟進...
關鍵字:
亞馬遜
汽車
NEC
數(shù)據(jù)庫
或者,如果你是一家企業(yè),你在業(yè)務中使用某種工具的頻率是多少?操作那臺機器的費用是多少?敏感實驗室設備周圍的電壓有多穩(wěn)定?你所在位置接收到的電能質量如何?例如,您可以使用這些信息來更好地估計產(chǎn)品成本,或者通過進行異常檢測或...
關鍵字:
Web應用程序
樹莓派
數(shù)據(jù)庫
上海——2025年6月20日 在2025亞馬遜云科技中國峰會上,全球知名的汽車制造商長城汽車宣布應用亞馬遜云科技Amazon Connect構建全球聯(lián)絡中心,實現(xiàn)了全球客服從統(tǒng)一渠道、客戶投訴分級與跟進、閉關管理到統(tǒng)計考...
關鍵字:
計算
存儲
數(shù)據(jù)庫