
若要設定和管理叢集資源,可使用 Web 使用者介面 HA Web Konsole (Hawk) 或 crm 外圍程序 (crmsh) 指令行公用程式。
利用 Hawk,您在非 Linux 機器上也可以監控和管理 Linux 叢集。此外,如果您的系統只提供了精簡的圖形使用者介面,那麼 Hawk 將是一個理想的解決方案。
本章對 Hawk 做了介紹,說明設定和管理叢集資源的基本任務:修改全域叢集選項,建立基本與進階類型的資源 (群組和複製品),設定條件約束,指定容錯移轉節點與錯誤回復節點,設定資源監控,啟動、清理或移除資源,以及手動移轉資源。Hawk 會產生叢集報告 (hb_report),以提供對叢集狀態的詳細分析。您可以檢視叢集歷程,或使用模擬器瞭解可能會發生的失敗情況。
使用 Hawk 的 Web 介面,在非 Linux 機器上也可以監控和管理 Linux 叢集。此外,如果您的系統只提供了精簡的圖形使用者介面,那麼 Hawk 將是一個理想的解決方案。
該 Web 介面包含在 hawk 套件中。您要使用 Hawk 與之連接的所有叢集節點上都必須安裝該套件,而在要透過 Hawk 存取某個叢集節點的機器上,只需有一個啟用了 JavaScript 和 Cookie 的 (圖形) 網頁瀏覽器即可建立連線。
若要使用 Hawk,您要透過 Web 介面與之連接的節點上必須啟動相應的 Web 服務。
如果您已使用 ha-cluster-bootstrap 套件中的程序檔設定了叢集,則 Hawk 服務現已啟動。此時,請跳過過程 5.1, “啟動 Hawk 服務”並繼續執行過程 5.2, “登入 Hawk Web 介面”。
在您要與之連接的節點上,開啟外圍程序並以 root 身分登入。
輸入以下指令檢查服務的狀態
root #systemctlstatus hawk.service
如果服務沒有執行,則使用以下指令將其啟動
root #systemctlstart hawk.service
如果想讓 Hawk 在系統開機時自動啟動,請執行以下指令:
root #systemctlenable hawk.service
Hawk 使用者必須是 haclient 群組的成員。安裝程序會建立名為 hacluster 的 Linux 使用者,該使用者已新增至 haclient 群組中。使用 ha-cluster-init 程序檔進行設定時,會為 hacluster 使用者設定預設密碼。
在啟動 Hawk 之前,請設定或變更 hacluster 使用者的密碼。或者,建立一個屬於 haclient 群組的新使用者。
請在您要使用 Hawk 與之連接的所有節點上執行此操作。
Hawk Web 介面使用 HTTPS 通訊協定和連接埠 7630。
在任一機器上,啟動網頁瀏覽器並確定已啟用 JavaScript 和 Cookie。
輸入任一執行 Hawk Web 服務之叢集節點的 IP 位址或主機名稱做為 URL。或者,輸入叢集操作人員可能已設定之任何 IPaddr(2) 資源的位址:
https://HOSTNAME_OR_IP_ADDRESS:7630/
當您首次嘗試存取該 URL 時,如果系統顯示證書警告,則表示使用了自行簽署的證書。依預設,自行簽署的證書不被視為可信證書。
請咨詢您的叢集操作人員取得證書詳細資料,以驗證該證書。
若仍要繼續,您可以在瀏覽器中新增一個例外以略過此警告。
如需關於如何將自行簽署的證書取代為官方證書管理中心所簽署證書的資訊,請參閱取代自行簽署的證書。
在 Hawk 登入螢幕中,輸入 hacluster 使用者 (或任何屬於群組 haclient 的其他使用者) 的和。
按一下。
螢幕即會出現,顯示叢集節點和資源的狀態。顯示的資訊類似於 crm 外圍程序中 crm status 的輸出。
登入後,Hawk 會顯示螢幕。該螢幕會顯示最重要的全域叢集參數及叢集節點與資源之狀態的摘要。以下色碼用於顯示節點和資源的狀態:
綠色:正常。例如,資源正在執行或節點正在線上。
紅色:錯誤,異常。例如,資源已失敗或節點未正常關閉。
黃色:轉換中。例如,節點目前正在關閉,或某個資源目前正在啟動或停止。如果您按一下某個暫停資源以檢視其詳細資料,Hawk 還會顯示該資源目前所處的狀態 (正在啟動、正在停止、正在移動、正在升級或正在降級)。
僅當操作內容
record-pending 設定為 true 時,資源的過渡狀態才會顯示。如果您使用 ha-cluster-init 程序檔設定了叢集,依預設,此內容會在全域範圍啟用。若要手動啟用,請使用 Hawk 的螢幕在下新增並啟用該內容,或者使用以下指令:
root #crmconfigure op_defaults record-pending=true
灰色:尚未執行,但叢集需要其執行。例如,管理員已停止或轉為待命模式的節點。另外,離線的節點也會顯示為灰色 (如果這些節點是正常關閉)。
除了色碼以外,Hawk 還會在螢幕的所有檢視窗中顯示節點、資源、票證狀態的相應圖示以及錯誤訊息的圖示。
如果資源發生了故障,螢幕頂部會以紅色顯示一則包含詳細資料的錯誤訊息。若要分析故障原因,請按一下錯誤訊息。如此會自動開啟 Hawk 的,並觸發時間跨度為 20 分鐘 (發生故障前 10 分鐘至發生故障後 10 分鐘) 的資料收集。如需詳細資訊,請參閱過程 5.27, “使用歷程總管檢視轉換”。
螢幕自身會以近即時頻率重新整理。您可以透過右上角的三個圖示在下列檢視窗之間切換:
同時顯示最重要的全域叢集參數及叢集節點與資源的狀態。如果您的設定包括地理叢集 (多站點叢集),則摘要檢視窗還會顯示票證。若要檢視屬於特定類別 (票證、節點或資源) 的所有元素的詳細資料,請按一下類別標題 (標示為連結)。否則,請按一下個別元素以檢視詳細資料。
顯示最重要的全域叢集參數及叢集節點和資源之狀態的可展開檢視。如果您的設定包括地理叢集 (多站點叢集),則樹狀檢視窗還會顯示票證。按一下箭頭可展開或折疊相應類別下的元素。與不同的是,此檢視不僅顯示資源的 ID 與狀態,還會顯示類型 (例如,基本資源、複製品或群組)。
對於群組,您還可以切換至可統一顯示 (群組中) 同一類型資源的檢視窗。在資源類別中按 ab 圖示,可在正常檢視窗 (分別顯示每個資源) 與按類型合併顯示資源的檢視窗之間切換。例如,如果一個群組中有三個類型為 ocf:pacemaker:Dummy 的資源,並且只有其中一個資源在執行,則按類型檢視的檢視窗將在灰色背景上顯示 1/3 ocf:pacemaker:Dummy 節點名稱。這表示 3 個資源中只有一個資源啟動。
此檢視對較大型叢集尤為有用,因為它會簡明地顯示哪個節點上目前正在執行哪些資源。此外,還會顯示非使用中的節點或資源。
主螢幕的頂層列會顯示您登入系統所用的使用者名稱。您還可以使用它 Web 介面,以及透過使用者名稱旁邊的扳手圖示存取下列:
。如需詳細資訊,請參閱第 5.4.7 節「瞭解可能發生的失敗個案」。
。選取此項將以圖形顯示 CIB 中設定的節點及資源。該圖表還會顯示各資源與節點指定之間的順序及並存關係 (分數)。
(hb_report)。如需詳細資訊,請參閱第 5.4.8 節「產生叢集報告」。
若要對節點和資源執行基本的操作人員任務 (例如啟動或停止資源、使節點上線或檢視詳細資料),請按一下相應節點或資源旁邊的扳手圖示。一個內容功能表即會顯示。針對任何狀態螢幕上的任何複製品、群組或主要/從屬子資源,從內容功能表中選取功能表項目。按一下此項可讓您執行啟動、停止等動作。基本資源所隸屬的頂層複製品或群組。
若要執行更複雜的任務,例如設定資源、條件約束或全域叢集選項,請使用左側的導覽列。您可以從該導覽列中存取以下螢幕:
:如需詳細資料,請參閱第 5.1.2 節「主螢幕︰叢集狀態」。
:如需詳細資料,請參閱過程 5.27, “使用歷程總管檢視轉換”。
:如需詳細資料,請參閱第 5.3.1 節「使用設定精靈設定資源」。
:如需詳細資料,請參閱第 5.2 節「設定全域叢集選項」。
:如需詳細資料,請參閱第 9 章「存取控制清單」。
:如需詳細資料,請參閱第 5.3 節「設定叢集資源」。
:如需詳細資料,請參閱第 5.3 節「設定叢集資源」。
依預設,以 root 或 hacluster 身分登入的使用者對於所有叢集組態任務都擁有完整的讀-寫存取權限。不過,您可以使用存取控制清單 來定義精細的存取權限。
如果 CRM 中啟用了 ACL,則 Hawk 的可用功能取決於指定給您的使用者角色和存取權限。此外,Hawk 的下列功能只能由使用者 hacluster 執行:
產生 hb_report。
使用。
檢視節點或資源的最近事件。
全域叢集選項控制叢集在遇到特定情況時的運作方式。這些選項分為不同的組,您可以使用 Hawk 與 crm 外圍程序等叢集管理工具來檢視和修改它們。一般情況下,可以保留預先定義的值。但是,為了讓叢集的關鍵功能正常運作,還需要在執行基本叢集設定後調整以下參數:
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中,選取以檢視全域叢集選項及目前值。Hawk 會顯示與 、和相關的最重要的參數。
根據您的叢集要求,調整。
將 設為適當的值。
如果您出於某些原因需要停用圍籬區隔,請取消選取。
系統不支援沒有 STONITH 的叢集。
若要從 CRM 組態中移除某個內容,請按一下該內容旁邊的減號圖示。如果某個內容被刪除,叢集會將該內容視為具有預設值。如需預設值的詳細資料,請參閱 第 4.2.6 節「資源選項 (中繼屬性)」。
若要為 CRM 組態新增新的內容,請從下拉式方塊中選擇一個內容,然後按一下加號圖示。
如果您需要變更或,請執行下列步驟:
若要變更已經顯示的預設值,請在相應的輸入欄位中編輯值。
若要新增新的資源預設值或操作預設值,請從空白下拉式清單中選擇一個項目,然後按一下加號圖示並輸入值。如果已定義預設值,Hawk 會自動提供這些預設值。
若要移除資源預設值或操作預設值,請按一下參數旁邊的減號圖示。如果沒有為和指定值,叢集會使用第 4.2.6 節「資源選項 (中繼屬性)」 及第 4.2.8 節「資源操作」 中所述的預設值。
確認您的變更。
做為叢集管理員,您需要為您叢集中的伺服器上執行的所有資源或應用程式建立叢集資源。叢集資源可以是網站、郵件伺服器、資料庫、檔案系統、虛擬機器,以及您希望使用者隨時都可以存取的其他伺服器型應用程式或服務。
有關您可以建立之資源類型的綜覽,請參閱第 4.2.3 節「資源類型」。除了資源的基本規格 (ID、類別、提供者和類型) 外,您還可以在建立資源期間或之後新增或修改以下參數︰
例項屬性 (參數) 決定資源控制的服務例項。若需更多資訊,請參閱第 4.2.7 節「例項屬性 (參數)」。
建立資源時,Hawk 會自動顯示所有需要的參數。請編輯這些參數以獲得有效的資源組態。
中繼屬性告訴 CRM 如何處理特定資源。如需詳細資訊,請參閱第 4.2.6 節「資源選項 (中繼屬性)」。
建立資源時,Hawk 會自動列出該資源的重要中繼屬性 (例如,用於定義資源初始狀態的 target-role 屬性,預設設為 Stopped,這樣資源便不會立即啟動)。
操作︰監控資源時需要用到。如需詳細資訊,請參閱第 4.2.8 節「資源操作」。
建立資源時,Hawk 會顯示最重要的資源操作 (monitor、start 和 stop)。
High Availability Extension 隨附了一組預先定義的樣板,用於一些常用的叢集個案,例如,設定高可用性 NFS 伺服器。hawk-templates 套件中包含這些預先定義的樣板。您也可以定義自己的精靈樣板。如需詳細資訊,請參閱 https://github.com/ClusterLabs/hawk/blob/master/doc/wizard.txt。
Hawk 提供了一個精靈,可引導您完成選定樣板的所有組態設定步驟。按照螢幕上的指示執行操作。如需關於某個選項的資訊,按一下該選項即可在 Hawk 中顯示簡要說明文字。
在下面的程序中,我們將使用精靈設定一個可用做 NFS(v4/v3) 容錯移轉伺服器的範例 NFS 伺服器。該精靈依存於已使用開機程序檔設定的叢集,因此已在節點間設定基於金鑰的 SSH 存取途徑。系統會提示您輸入以下資訊:
您透過 Hawk 登入之機器的 root 密碼。該密碼必須與 Hawk 在修改其檔案系統時需要處理之所有叢集節點上的密碼相同。
基礎檔案系統資源的 ID。
NFSv4 檔案系統根目錄的詳細資料。
NFSv3 輸出的詳細資料。NFS 伺服器輸出的目錄,用戶端可將該目錄整合到其系統中。
一個浮動 IP 位址。
最終的 Pacemaker 組態將包含以下資源:
管理用於透過 NFS 網路通訊協定向用戶端本地掛接之檔案系統提供服務的核心內 Linux NFS 精靈。
管理 NFSv4 用戶端所需的虛擬 NFS 根目錄輸出。此資源不存放 NFS 輸出的任何實際資料,而只包含其他 NFS 輸出將要掛接到的空目錄 (/srv/nfs)。
管理 NFSv3 輸出。
一個虛擬浮動叢集 IP 位址,NFS 用戶端可透過該位址連接到服務,而不管該服務在哪個實體節點上執行。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。會列出可用的資源樣板。如果您按一下某個項目,Hawk 會顯示該樣板的簡要說明文字。
選擇您要設定之資源 (在本案例中為 NFS 伺服器) 的樣板,然後按。
若要設定高可用性 NFS 伺服器,請執行下列步驟:
輸入目前機器的 root 密碼,然後按。如果您不輸入 root 密碼,組態精靈將無法進行必要的組態變更。
在下一個螢幕中,輸入相應的根 ID 以指定要透過 NFS 輸出的。按一下。
在下一個螢幕中,輸入虛擬 NFSv4 檔案系統根目錄的詳細資料 (NFSv4 用戶端需要這些資料)。指定以下參數,然後按。
定義要用於此叢集資源的。
輸入。依預設,Hawk 會建議指定 0,因為根檔案系統的 ID 必須是 0 或字串 root。
指定一個,例如:/srv/nfs。
輸入用於用戶端存取的。例如 10.9.9.0/255.255.255.0。如果保留 Hawk 建議的值 *,則表示允許處於任何位置的所有用戶端存取。
指定。對於 NFSv4 檔案系統根目錄,Hawk 會建議指定 rw,crossmnt。
在下一個螢幕中,輸入所輸出 NFS 掛接點的詳細資料。指定以下參數,然後按。
定義要用於此叢集資源的。
輸入。依預設,Hawk 會建議指定 1。不代表 NFSv4 虛擬檔案系統根目錄的 NFS 輸出 ID 必須設定為唯一的正整數,或者 UUID 字串 (32 個含有任意標點符號的十六進位數字)。
指定一個,例如:/srv/nfs/example。
輸入用於用戶端存取的。例如 10.9.9.0/255.255.255.0。如果保留 Hawk 建議的值 *,則表示允許處於任何位置的所有用戶端存取。
指定。對於 NFSv3 輸出,Hawk 會建議指定 rw,mountpoint。
在下一個螢幕中,設定用於存取 NFS 掛接系統的虛擬 IP。指定以下參數︰
定義要用於此叢集資源的。
以點分四組表示法輸入 。
(選擇性) 輸入。如果未指定,系統會自動決定網路遮罩。
若為 LVS 直接路由組態,請啟用 。否則,請將它保留為停用狀態。
按一下。
精靈會顯示要套用至 CIB 的組態片段。
若要套用此組態,請按。
您已成功設定 NFS(v4/v3) 容錯移轉伺服器。
若要建立最基本的資源類型,請執行下列步驟:
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中,選取。螢幕會顯示所有資源類型的類別,並會列出所有已定義的資源。
選取類別並按一下加號圖示。
指定資源︰
輸入唯一的。
在清單中,選取您要針對該資源使用的資源代辦類別:、、 或 。如需詳細資訊,請參閱第 4.2.2 節「受支援的資源代辦類別」。
如果選取了類別,請指定 OCF 資源代辦的。OCF 規格允許多個廠商提供相同的資源代辦。
在清單中,選取要使用的資源代辦 (例如或)。此資源代辦的簡要描述即會顯示。
清單中顯示的選項取決於您所選的(對於 OCF 資源,還取決於)。
Hawk 會自動顯示資源所需的所有參數,以及一個空白下拉式方塊供您指定其他參數。
若要定義資源的(例項屬性)︰
輸入各所需參數的值。按一下參數旁邊的文字方塊,一段簡要說明文字便會顯示。
若要完全移除某個參數,請按一下該參數旁邊的減號圖示。
若要新增其他參數,請按一下空白下拉式清單,然後選取參數並輸入其值。
Hawk 會自動顯示最重要的資源並提供建議的預設值。如果此時不修改任何設定,Hawk 將會在您確認變更後新增其建議的操作及其預設值。
如需關於如何修改、新增或移除操作的詳細資料,請參閱過程 5.15, “新增或修改監控操作”。
Hawk 會自動列出資源最重要的中繼屬性,例如 target-role。
若要修改或新增︰
若要為屬性設定一個 (不同的) 值,請從屬性旁邊的下拉式方塊中選取值,或編輯輸入欄位中的值。
若要完全移除某個中繼屬性,請按一下該屬性旁邊的減號圖示。
若要新增其他中繼屬性,請按一下空白下拉式方塊並選取一個屬性。該屬性的預設值即會顯示。如有需要,請依上文所述變更該值。
按一下完成組態。螢幕頂部的訊息會顯示該資源是否已成功建立。
系統不支援沒有 STONITH 的叢集。
依預設,全域叢集選項 stonith-enabled 設定為 true:如果未定義 STONITH 資源,叢集將拒絕啟動任何資源。設定一或多個 STONITH 資源以完成 STONITH 設定。儘管 STONITH 的設定與其他資源相似,但它們的行為在某些方面有所不同。如需詳細資料,請參閱第 8.3 節「STONITH 組態」。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中,選取。螢幕會顯示所有資源類型的類別,並列出所有定義的資源。
選取類別並按一下加號圖示。
指定資源︰
輸入唯一的。
在清單中,選取資源代辦類別。
從清單中,選取用於控制 STONITH 裝置的 STONITH 外掛程式。此外掛程式的簡要描述即會顯示。
Hawk 會自動顯示資源的必要。請輸入每個參數的值。
Hawk 會顯示最重要的資源並提供建議的預設值。如果此時不修改任何設定,Hawk 將會在您確認後新增其建議的操作及其預設值。
如無特定原因,請採用預設的設定。
確認變更以建立 STONITH 資源。
若要完成圍籬區隔組態,請新增條件約束或使用複製品,或同時使用這兩種方式。如需詳細資訊,請參閱第 8 章「圍籬區隔與 STONITH」。
如果您要建立大量具有相似組態的資源,定義資源樣板是最輕鬆的方法。定義資源樣板後,您可以在基本資源或某些類型的條件約束中參考該樣板。如需有關資源樣板功能和用法的詳細資訊,請參閱第 4.4.3 節「資源樣板和條件約束」。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中,選取。螢幕會顯示所有資源類型的類別,以及類別。
選取類別並按一下加號圖示。
輸入。
像指定基本資源一樣指定資源樣板。請依照過程 5.5: 新增基本資源 中的說明從步驟 4.b 開始。
按一下完成組態。螢幕頂部的訊息會顯示該資源樣板是否已成功建立。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
若要在基本資源中參考新建的資源樣板,請執行以下步驟:
在左側導覽列中,選取。螢幕會顯示所有資源類型的類別,並會列出所有定義的資源。
選取類別並按一下加號圖示。
輸入唯一的。
啟用,然後從下拉式選單中選取要參考的樣板。
如果需要,請依照過程 5.5, “新增基本資源” 所述指定更多、或。
若要在並存或順序條件約束中參考新建的資源樣板,請執行過程 5.10, “新增或修改並存或順序條件約束” 所述的步驟。
設定所有資源後,需要指定叢集應如何正確處理這些資源。資源條件約束可讓您指定資源可在哪些叢集節點上執行,載入資源的順序以及特定資源所依賴的其他資源。
如需可用條件約束類型的綜覽,請參閱第 4.4.1 節「條件約束類型」。定義條件約束時,還需要指定分數。如需叢集中分數及其含義的詳細資訊,請參閱第 4.4.2 節「分數與無限大」。
下列程序將介紹如何建立不同類型的條件約束。
對於位置條件約束,需要指定條件約束 ID、資源、分數和節點:
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。螢幕會顯示所有條件約束類型的類別,並會列出所有定義的條件約束。
若要新增新的條件約束,請按一下相應類別中的加號圖示。
若要修改某個現有條件約束,請按一下該條件約束旁邊的扳手圖示,然後選取。
輸入唯一的。若您目前在修改現有條件約束,那麼其 ID 已經定義。
選取要對其定義條件約束的。清單會顯示已為叢集設定之所有資源的 ID。
為條件約束設定。正值表示資源可以在您下一步中指定的上執行。負值表示資源不應在該節點上執行。將分數設定為 INFINITY 會強制資源在該節點上執行。分數設定為 -INFINITY 表示資源不得在該節點上執行。
為條件約束選取。
按一下完成組態。螢幕頂部的訊息會顯示該條件約束是否已成功建立。
對這兩種類型的條件約束需要指定條件約束 ID 和分數,然後將資源新增至相依性鏈結:
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。螢幕會顯示所有條件約束類型的類別,並列出所有定義的條件約束。
若要新增新的或條件約束,請按一下相應類別中的加號圖示。
若要修改某個現有條件約束,請按一下該條件約束旁邊的扳手圖示,然後選取。
輸入唯一的。若您目前在修改現有條件約束,那麼其 ID 已經定義。
定義。
對於並存條件約束,分數可以確定資源之間的位置關係。正值表示資源應該在同一個節點上執行。負值表示資源不應該在同一個節點上執行。將分數設定為 INFINITY 會強制資源在同一節點上執行。分數設定為 -INFINITY 表示資源不得在同一節點上執行。該分數會結合其他因素來決定將資源配置於何處。
對於順序條件約束,如果分數大於零,則必須滿足條件約束,否則,條件約束只是一項建議。預設值為 INFINITY。
對於順序條件約束通常可以啟用選項。這會指定資源停止時使用相反順序。
若要為條件約束定義資源,請執行以下步驟:
從清單中選取一個資源。清單會顯示為叢集設定之所有資源和資源樣板的 ID。
若要新增選定的資源,請按一下清單旁邊的加號圖示。下方即會出現一個新清單。從該清單中選取下一個資源。由於並存和順序條件約束都是定義資源之間的相依性,因此您至少需要兩個資源。
從清單中選取另一個資源。按一下加號圖示以新增該資源。
現在,相依性鏈結中已經有了兩個資源。
如果定義了順序條件約束,則最頂端的資源會先啟動,接著是第二個資源,依此類推。通常,資源停止時會使用相反順序。
但是,如果您定義的是並存條件約束,則資源之間的箭頭圖示反映的是它們之間的相依性,而不是其啟動順序。由於最頂端的資源依賴於下一個資源 (下面的資源依此類推),叢集首先會決定向哪個位置放置最後一個資源,然後根據該決定放置依賴資源。若無法符合條件約束要求,叢集可能會決定不允許執行相依資源。
為並存或順序條件約束新增所需數量的資源。
如果您要交換兩個資源的順序,按一下資源右側的雙箭頭即可在相依性鏈結中交換資源順序。
如果需要,請為每個資源指定更多參數,例如角色 (「主要」、「從屬」、「已啟動」或「已停止」)。
按一下完成組態。螢幕頂部的訊息會顯示該條件約束是否已成功建立。
您可以使用另一種形式來定義條件約束,即資源集。資源集的順序語意與群組相同。
自 SUSE Linux Enterprise High Availability Extension 12 開始,現在也可以在位置條件約束中使用資源集。以前只能在並存和順序條件約束中使用資源集。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
若要在位置條件約束中使用資源集:
依照過程 5.9, “新增或修改位置條件約束”中的步驟 1 至步驟 5 所述操作。
不要只選取一個資源,而是在按住 Ctrl 或 Shift 的同時按滑鼠來選取多個資源。如此就會在位置條件約束中建立一個資源集。
然後,輸入條件約束的並選取一個。
若要從位置條件約束中移除某個資源,請在按住 Ctrl 的同時再次按一下該資源即可將其取消選取。如果您正在編輯現有的位置條件約束,請按一下以確認您的選擇。
若要在並存或順序條件約束中使用資源集:
依 過程 5.10, “新增或修改並存或順序條件約束” 所述進行。
將資源新增至相依性鏈結後,按一下右側的鏈結圖示即可將這些資源放入資源集。屬於資源集的資源四周以框架圍起,以此標示資源集。
您也可以將多個資源新增至某個資源集,或建立多個資源集。
若要從資源集中去除某個資源,請按一下相應資源上方的剪刀圖示。
該資源即會從集中移除,並放回到它在相依性鏈結中的原始位置。
確認變更以完成條件約束組態。
如需設定條件約束的詳細資訊,以及關於順序與並存基本概念的詳細背景資訊,請參閱 http://www.clusterlabs.org/doc/ 上提供的文件:
《Pacemaker Explained (Pacemaker 1.1 for Corosync 2.x and crmsh)》(Pacemaker 說明 (適用於 Corosync 2.x 與 crmsh 的 Pacemaker 1.1)) 中的「Resource Constraints」(資源條件約束) 章節
《Colocation Explained》(並存說明)
《Ordering Explained》(順序說明)
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。螢幕會顯示所有條件約束類型的類別,並列出所有定義的條件約束。
按一下條件約束旁邊的扳手圖示,然後選取。
若資源失敗,系統會自動將其重新啟動。若在目前節點上無法將其重新啟動,或資源已在目前節點上失敗 N 次,則資源會嘗試容錯移轉至其他節點。您可以定義一個數值,讓資源在失敗該次數 (migration-threshold) 之後移轉至新節點。如果叢集中有兩個以上的節點,則某個資源應容錯移轉至哪個節點由 High Availability 軟體來選擇。
您可以執行以下步驟指定資源容錯移轉至某個特定節點:
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
依過程 5.9, “新增或修改位置條件約束” 所述為該資源設定位置條件約束。
依過程 5.5: 新增基本資源 中的步驟 7 所述將 migration-threshold 中繼屬性新增至該資源,並為該 migration-threshold 輸入一個。該值應該為小於 INFINITY 的正數。
若要讓資源的 failcount 自動過期,請依過程 5.5: 新增基本資源 中的步驟 7 所述將 failure-timeout 中繼屬性新增至該資源,並為該 failure-timeout 輸入一個。
若要指定具有資源優先設定的其他容錯移轉節點,請建立其他位置條件約束。
範例 4.6 「移轉限定值 — 程序流程」 中演示了關於 migration-threshold 和 failcount 的程序流程。
您也可以隨時手動清理資源的 failcount,而不是等待資源的 failcount 自動過期。如需詳細資訊,請參閱第 5.4.2 節「清理資源」。
當原始節點重新回到線上和叢集中時,資源可能會回復至該節點。若要防止此狀況,或要為資源指定不同的錯誤回復節點,請變更資源的粘性值。您可以在建立資源時指定資源粘性,也可以在以後指定。
有關不同資源粘性值的含義,請閱第 4.4.5 節「錯誤回復節點」。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
依過程 5.5: 新增基本資源 中的步驟 7 所述將 resource-stickiness 中繼屬性新增至資源。
為 resource-stickiness 指定介於 -INFINITY 和 INFINITY 之間的值。
並非所有資源都相同。有些資源 (例如 Xen 客體作業系統) 要求代管它們的節點滿足其容量要求。如果投放資源後,所需的容量總和超出了提供的容量,則資源效能將會下降,或者資源將會失敗。
鑒於此,High Availability Extension 允許您指定以下參數:
特定節點提供的容量。
特定資源要求的容量。
配置資源的整體策略。
使用率屬性用於設定資源的要求以及節點提供的容量。High Availability Extension 現在還提供了用於自動偵測和設定節點容量及資源要求的方法。如需詳細資料及組態範例,請參閱第 4.4.6 節「依據負載影響放置資源」。
若要顯示節點的容量值 (透過使用率屬性定義) 以及節點上執行之資源目前使用的容量,請在 Hawk 中切換至螢幕。選取要查看的節點,按一下該節點旁邊的扳手圖示,然後選取。
設定好節點提供的容量和資源需要的容量後,需在全域叢集選項中設定放置策略,否則容量組態將不會生效。可以使用幾個策略來排程負載:例如,您可將負載集中於最少的節點上,或在所有可用的節點上平均分攤。若需更多資訊,請參閱第 4.4.6 節「依據負載影響放置資源」。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中,選取以檢視全域叢集選項及目前值。
從下拉式清單中,選擇 placement-strategy。
根據要求將設定為適當的值。
按一下加號圖示以新增新的叢集內容 (包括其值)。
確認您的變更。
High Availability Extension 不僅能夠偵測節點失敗,還能偵測到節點上個別資源失敗的情況。若要確定某個資源是否正在執行,請對其設定資源監控。設定資源監控需指定逾時和/或啟動延遲值以及間隔。該間隔會告知 CRM 應檢查資源狀態的頻率。您還可以設定特定參數,例如為 start 或 stop 操作設定 Timeout。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中,選取。螢幕會顯示所有資源類型的類別,並列出所有定義的資源。
選取要修改的資源,按一下該資源旁邊的扳手圖示,然後選取。資源定義即會顯示。Hawk 會自動顯示最重要的資源操作 (monitor、start、stop) 並提供建議的預設值。
若要變更某個操作的值:
按一下該操作旁邊的筆型圖示。
在開啟的對話方塊中指定以下值:
輸入一個逾時值 (以秒計)。操作在經過指定的逾時期間之後會被視為 failed。PE 將會決定需要採取的措施,或執行您在監控操作的欄位中指定的動作。
對監控操作定義監控間隔 (以秒計)。
如果需要,請使用對話方塊底部的空白下拉式方塊新增更多參數,例如 (如果此動作失敗應採取什麼措施?)或(需要符合哪些條件才執行此動作?)。
確認變更以關閉此對話方塊,並返回螢幕。
若要完全移除某個操作,請按一下該操作旁邊的減號圖示。
若要新增其他操作,請按一下空白下拉式方塊並選取一個操作。該操作的預設值即會顯示。必要時可按一下鋼筆圖示來變更預設值。
按一下完成組態。螢幕頂部的訊息會顯示該資源是否已成功更新。
有關資源監控偵測到失敗時應執行的程序,請參閱第 4.3 節「資源監控」。
若要檢視發生的資源故障,請在 Hawk 中切換至螢幕,然後選取要查看的資源。按一下該資源旁邊的扳手圖示,然後選取。
某些叢集資源依賴於其他元件或資源,且要求每個元件或資源以特定順序啟動並在同一個伺服器上執行。若要簡化此組態,您可以使用群組。
如需資源群組的範例和群組及其內容的詳細資訊,請參閱第 4.2.5.1 節「群組」。
群組至少須包含一個資源,否則組態視為無效。在 Hawk 中,建立群組時無法建立或修改基本資源。請在新增群組之前建立基本資源並視需要對其進行設定。如需詳細資訊,請參閱過程 5.5, “新增基本資源”。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中,選取。螢幕會顯示所有資源類型的類別,並列出所有定義的資源。
選取類別並按一下加號圖示。
輸入唯一的。
若要定義群組成員,請在清單中選取一或多個項目,然後按一下 < 圖示將其新增至清單中。所有新的群組成員都會新增至清單底部。若要定義群組成員的順序,目前您需要依所需順序逐個新增和移除這些群組成員。
按一下完成組態。螢幕頂部的訊息會顯示該群組是否已成功建立。
如果希望某些資源同時在叢集中的多個節點上執行,請將這些資源設定為複製品。例如,您可以對 STONITH 這樣的資源以及 OCFS2 這樣的叢集檔案系統使用複製功能。您可以複製所提供的任何資源。資源的資源代辦支援複製。根據複製品資源執行時所在的節點,您可以對這些資源進行不同的設定。
如需可用資源複製品類型的綜覽,請參閱第 4.2.5.2 節「複製品」。
複製品可以將基本資源或群組做為子資源。在 Hawk 中,建立複製品時無法建立或修改子資源。請在新增複製品之前建立子資源並視需要對其進行設定。如需詳細資訊,請參閱過程 5.5, “新增基本資源” 或過程 5.16, “新增資源群組”。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中,選取。螢幕會顯示所有資源類型的類別,並列出所有定義的資源。
選取類別並按一下加號圖示。
輸入唯一的。
從清單中,選取要做為複製品子資源的基本資源或群組。
如果需要,請依照過程 5.5: 新增基本資源中的步驟 7 所述修改或新增。
按一下完成組態。螢幕頂部的訊息會顯示該複製品是否已成功建立。
除了設定叢集資源外,Hawk 還可讓您透過螢幕管理現存資源。有關此螢幕的一般綜覽、不同檢視以及用於狀態資訊的色碼,請參閱第 5.1.2 節「主螢幕︰叢集狀態」。
從任何叢集狀態檢視中都可執行基本的資源操作。從和中,都可以直接存取個別資源。但是,在中,您需要先按一下資源類別中的連結,以顯示資源詳細資料。詳細的檢視窗還會顯示為該資源設定的所有屬性。對於基本資源 (一般的基本資源,群組、複製品或主要/從屬資源的子代),還會額外顯示下列資訊:
資源的失敗計數
上次失敗時戳 (如果失敗計數 > 0)
操作歷程及時間 (呼叫 ID、操作、上次執行時戳、執行時間、佇列時間、傳回代碼及上次變更時戳)
啟動叢集資源之前,請先確定該資源已正確設定。例如,如果想要使用 Apache 伺服器做為叢集資源,請先設定 Apache 伺服器。完成 Apache 組態設定後,再在叢集中啟動相應的資源。
當您正透過 High Availability Extension 管理某個資源時,就不能再啟動或停止該資源 (例如,不能在叢集之外手動啟動或停止,或者在開機或重新開機時啟動或停止)。High Availability Extension 軟體負責所有服務的啟動或停止動作。
不過,如果您要檢查服務是否正確設定,請手動將其啟動,但務必在 High Availability 接管之前將它再次停止。
若要對目前由叢集管理的資源進行干預,請先依照過程 5.23, “向資源套用維護模式”所述將資源設定為維護模式。
透過 Hawk 建立資源時,您可以使用 target-role 中繼屬性設定該資源的初始狀態。如果將其值設定為 stopped,則資源建立後不會自動啟動。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。
在其中一個資源檢視中,按一下資源旁邊的扳手圖示,然後選取。若要繼續,請確認顯示的訊息。資源啟動後,Hawk 會將該資源的色彩變為綠色,並顯示目前執行該資源的節點。
如果資源失敗,系統會自動將其重新啟動,但每次失敗都會增加該資源的 failcount。
如果為資源設定了 migration-threshold,則當失敗次數達到移轉限定值時,節點將不再執行該資源。
資源的 failcount 可自動重設 (若為資源設定 failure-timeout 選項),也可按如下方式手動重設。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。
在其中一個資源檢視中,按一下失敗資源旁邊的扳手圖示,然後選取。若要繼續,請確認顯示的訊息。
如此會對指定節點上的指定資源執行指令 crm_resource 與 -Ccrm_failcount 。
-D
如需詳細資訊,請參閱 crm_resource 與 crm_failcount 的 man 頁面。
如果需要從叢集移除資源,請按照下面的程序操作,以免出現組態錯誤:
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。
依照過程 5.19, “清理資源” 中的說明在所有節點上清理該資源。
在其中一個資源檢視中,按一下資源旁邊的扳手圖示,然後選取。若要繼續,請確認顯示的訊息。
如果資源已停止,請按一下資源旁邊的扳手圖示,然後選取。
如第 5.3.6 節「指定資源容錯移轉節點」 所述,當軟體或硬體發生故障時,叢集會自動對資源進行容錯移轉 (移轉),具體情況視您可以定義的特定參數 (例如移轉限定值或資源粘性) 而定。除此之外,您也可以手動將資源移轉至叢集中的其他節點。或者,您可以選擇將資源移出目前節點,並讓叢集決定要將它放在哪個位置。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。
在其中一個資源檢視中,按一下資源旁邊的扳手圖示,然後選取。
在新視窗中選取要將資源移至其中的節點。
如此會建立一個位置條件約束,其目的節點的分數為 INFINITY。
或者,選擇將資源。
如此會建立一個位置條件約束,其目前節點的分數為 -INFINITY。
按一下以確認移轉。
若要讓資源回到原來的狀態,請執行下列步驟:
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。
在其中一個資源檢視中,按一下資源旁邊的扳手圖示,然後選取。若要繼續,請確認顯示的訊息。
此過程會使用 crm_resource 指令。資源可以移回其原始位置,也可以保留在目前的位置 (具體取決於資源粘性)。
-U
如需詳細資訊,請參閱 crm_resource man 頁面或 http://www.clusterlabs.org/doc/ 上的《Pacemaker Explained (Pacemaker 1.1 for Corosync 2.x and crmsh)》(Pacemaker 說明 (適用於 Corosync 2.x 與 crmsh 的 Pacemaker 1.1))。可參閱其中的「Resource Migration」(資源移轉) 一節。
您可能不時地需要對個別叢集元件或整個叢集執行測試或維護任務 — 變更叢集組態、更新個別節點的軟體套件,或者將叢集升級到更高的產品版本。
為此,High Availability Extension 提供了針對多個層級的 maintenance 選項:
當服務在叢集控制下執行時,如果您需要執行任何測試或維護任務,請務必遵循以下指南:
在開始之前,請將個別資源、節點或整個叢集設定為維護模式。這有助於避免一些不利的負面影響,例如,資源不按順序啟動、出現叢集節點間 CIB 不同步或資料遺失的風險。
執行維護任務或測試。
完成後,請解除維護模式以開始正常的叢集操作。
如需處於維護模式的資源和叢集會發生之情況的詳細資料,請參閱第 4.7 節「維護模式」。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中,選取。選取要將其置於維護模式或不受管理模式的資源,然後按一下資源旁邊的扳手圖示並選取。
開啟類別。
從空白下拉式清單中,選取 屬性並按一下加號圖示新增該屬性。
啟用 maintenance 旁邊的核取方塊,將 maintenance 屬性設定為 yes。
確認您的變更。
完成針對該資源的維護任務後,停用該資源 maintenance 屬性旁邊的核取方塊。
從此時起,資源將重新由 High Availability Extension 軟體管理。
有時,需要將個別節點置於維護模式。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。
在其中一個節點檢視窗中,按一下節點旁邊的扳手圖示,然後選取。
如此會將以下例項屬性新增至該節點:maintenance="true"。先前在這個維護模式節點上執行的資源將會變成未受管理模式。在該節點脫離維護模式之前,系統將不會為其配置任何新的資源。
若要停用維護模式,請按一下節點旁邊的扳手圖示,然後選取。
若要為整個叢集設定或取消設定維護模式,請執行下列步驟:
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。
在 群組中,從空白下拉式方塊中選取 屬性,然後按一下加號圖示新增該屬性。
若要設定 maintenance-mode=true,請啟用 maintenance-mode 旁邊的核取方塊,並確認您所做的變更。
完成針對整個叢集的維護任務後,停用 maintenance-mode 屬性旁邊的核取方塊。
從此刻起,High Availability Extension 會再次接管叢集管理工作。
Hawk 提供了以下用於檢視叢集過往事件 (按不同的層級和不同的詳細程度) 的功能。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。
在或中,按一下目標資源或節點旁邊的扳手圖示,然後選取。
開啟的對話方塊即會顯示前一個小時的事件。
提供某個時間範圍內 (您可以定義此時間範圍) 的轉換資訊。它還會列出其先前執行的歷程,並可讓您不再需要的報告。使用 hb_report 提供的資訊。您還可以使用歷程總管上傳在其他叢集上離線建立的 歸檔,並檢視相應的轉換。請參閱過程 5.28, “離線使用”。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
在左側導覽列中選取。
瀏覽時段預設設為過去的 24 小時。若要修改此值,請設定其他和。
按一下開始收集轉換資料。
下列資訊就會顯示:
叢集中所有過往轉換的時間表。
在某些情況下,與 欄之間會顯示資訊圖示。將滑鼠指標移至該圖示的上方會顯示下列其中一則訊息:
輸入由另一個 Pacemaker 版本建立。在這種情況下,轉換圖表只會反映大致情況,因為這些圖表是由其他 PE 版本產生的。
PE 輸入中不存在 Pacemaker 版本。此訊息會在叢集啟動期間尚未選取 DC 時顯示。
每個轉換的 pe-input* 檔案以及產生該檔案的節點。叢集會為每個轉換儲存一個狀態副本,並提供給規則引擎以做為輸入。系統會記錄此歸檔的路徑。這些 pe-input* 檔案只會在指定協調者 (DC) 上產生,但由於 DC 可能會變更,因此有些 pe-input* 檔案可能來自多個節點。這些檔案顯示了規則引擎 (PE) 計畫執行的操作。
開啟一個快顯視窗,其中會顯示屬於該特定轉換之記錄資料的片段。視窗可以顯示不同程度的詳細資料:按一下會顯示 crm history transition peinput 的輸出 (包括資源代辦的記錄訊息)。按一下還會顯示來自 pengine、crmd 與 lrmd 的詳細資料,該按鈕的作用相當於 crm history transition log peinput 指令。
每個轉換的圖形與 XML 表示。如果選擇顯示,系統將重新呼叫 PE (使用 pe-input* 檔案),並以圖形方式來顯示轉換。或者,您可以檢視圖形的 XML 表示。
如果列出的 pe-input 有兩個或兩個以上,每個 pe-input 配對的右側會顯示一個連結。按一下該連結將會顯示組態與狀態的差異。
只要任何一個機器上在執行 Hawk,您還可以「離線」使用,這意味著,您可以檢視和分析目前未連接之叢集的轉換。您只需提供一個 TAR 歸檔,該歸檔包含 SUSE Linux Enterprise High Availability Extension 叢集上產生的 hb_report。若要使用上傳和分析該歸檔,請執行下列步驟:
啟動網頁瀏覽器,並依第 5.1.1 節「啟動 Hawk 及登入」所述登入 Hawk Web 介面。
在左側導覽列中選取。
此時會顯示項目。
按一下,然後選取要從您的檔案系統上傳的 hb_report 歸檔。
按一下開始分析該歸檔,並顯示歷程總管結果中所列的資訊。
Hawk 提供了一個,可讓您瞭解會發生的故障情境,以防患於未然。切換至模擬器模式後,可以變更節點狀態,新增或編輯資源與條件約束,變更叢集組態,或執行多個資源操作,以瞭解這些事件發生時叢集的行為。只要啟動模擬器模式,螢幕右下角就會顯示一個控制對話方塊。模擬器會收集所有螢幕中發生的變更並將它們新增至其內部事件佇列中。除非在控制對話方塊中手動觸發,否則使用排入佇列的事件來執行模擬將不會成功。執行模擬後,您可以檢視並分析可能會發生的情況的詳細資料 (記錄片段、轉換圖形和 CIB 狀態)。
啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
若要啟用模擬器模式,請按一下頂層列中的扳手圖示 (使用者名稱旁邊),然後選取。
Hawk 的背景色彩即會變更,指出模擬器正在使用中。模擬器控制對話方塊顯示在螢幕右下角。其標題指示尚未執行過模擬器。
填入模擬器的事件佇列:
若要模擬某個節點的狀態變更:在模擬器控制對話方塊中按一下。選取您要操作的,並選取其目標。確認變更,以將其新增至控制器對話方塊中列出的事件佇列中。
若要模擬資源操作:在模擬器控制對話方塊中按一下。選取要操作的,以及要模擬的。如有必要,請定義一個。選取要在其上執行該操作的以及預期的。確認變更,以將其新增至控制器對話方塊中列出的事件佇列中。
對要模擬的任何其他節點狀態或資源操作重複上述步驟。
若要插入其他要模擬的變更:
切換至下列一或多個 Hawk 螢幕:、、、或。
按一下索引標籤將停用模擬器模式。
視需要在螢幕上新增或修改參數。
模擬器會收集所有螢幕中發生的變更並將它們新增至其內部事件佇列中。
若要回到模擬器控制對話方塊,請切換至螢幕,或按一下頂層列中的扳手圖示,然後再次按一下。
如果要移除中列出的事件,請選取相應的項目,然後按一下清單下方的減號圖示。
在模擬器控制對話方塊中按一下,啟動該輪模擬。螢幕即會顯示模擬的事件。例如,如果將某個節點標示為未清理,該節點現在將顯示為離線,並且它的所有資源都將停止。模擬器控制對話方塊將變更為。
若要檢視關於模擬執行的更多詳細資訊:
在模擬器對話方塊中按一下連結,以查看所發生之情況的記錄片段。
按一下連結,以顯示轉換圖形。
按一下,以顯示初始 CIB 狀態。若要查看轉換後 CIB 的內容,請按一下。
若要從頭開始進行一次新模擬,請使用按鈕。
若要離開模擬模式,請關閉模擬器控制對話方塊。螢幕將切換回其正常色彩,並顯示目前叢集狀態。
為了分析和診斷叢集發生的問題,Hawk 可以產生叢集報告,用於從叢集中的所有節點收集資訊。
hb_report #啟動網頁瀏覽器並依第 5.1.1 節「啟動 Hawk 及登入」 所述登入叢集。
按一下頂層列中使用者名稱旁邊的扳手圖示,然後選取。
檢查時段預設為過去 1 小時。若要修改此值,請設定其他和。
按一下。
建立報告後,按一下相應的連結以下載 *.tar.bz2 檔案。
如需 hb_report 和 crm_report 等工具涉及之記錄檔案的詳細資訊,請參閱如何建立一份包含所有叢集節點分析資訊的報告?。
Hawk 可以用做監控多個叢集的單一管理點。Hawk 的可讓您檢視多個叢集的摘要,其中每個摘要會列出節點、資源、票證 (如果使用地理叢集) 的數量及其狀態。摘要還會顯示相應叢集中是否發生過故障。
中所顯示的叢集資訊儲存在永久的 cookie 中。這表示您需要決定要在上檢視的 Hawk 例項,之後就必須永遠使用該例項。要實現此目的,執行 Hawk 的機器甚至不需要屬於任何叢集,它可以是獨立的、不相關的系統。
要從 Hawk 的監控的所有叢集都必須執行 SUSE Linux Enterprise High Availability Extension 12。Hawk 無法監控執行 SUSE Linux Enterprise High Availability Extension 較低版本的叢集。
如果您沒有在每個叢集節點上以您自己的證書 (或官方證書管理中心簽署的證書) 取代 Hawk 的自行簽署證書,請在每個叢集中的每個節點上至少登入 Hawk 一次。驗證證書 (並在瀏覽器中新增一個例外以使警告不再顯示)。
如果您使用的是 Mozilla Firefox,則必須將其優先設定變更為,否則 Hawk 中將不會設定來自受監控叢集的 cookie,從而阻止您登入您試圖監控的叢集。
在要用於監控多個叢集的機器上啟動 Hawk Web 服務。
啟動網頁瀏覽器,並輸入執行 Hawk 之機器的 IP 位址或主機名稱做為 URL:
https://IPaddress:7630/
在 Hawk 登入螢幕中,按一下右上角的連結。
對話方塊即會出現。
輸入,用於在中識別叢集。
輸入其中一個叢集節點的,然後確認變更。
隨即開啟,並顯示您所新增之叢集的摘要。
若要將更多叢集新增至該儀表板,請按一下加號圖示,然後輸入下一個叢集的詳細資料。
若要從儀表板中移除某個叢集,請按一下該叢集摘要旁邊的 x 圖示。
若要檢視關於叢集的更多詳細資料,請按一下儀表板上叢集方塊中的某個位置。
這會開啟一個新的瀏覽器視窗或新的瀏覽器索引標籤。如果您目前未登入叢集,此操作會顯示 Hawk 登入螢幕。登入後,Hawk 會在摘要檢視窗中顯示該叢集的。從此處,您可以如常使用 Hawk 來管理叢集。
因為始終是在獨立的瀏覽器視窗或索引標籤中開啟,在 Hawk 中,您可以輕鬆地在儀表板與各叢集管理任務之間切換。
節點或資源的任何狀態變更幾乎都會即時反映在中。
如需與地理位置分散叢集 (地理叢集) 相關之 Hawk 功能的詳細資料,請參閱《Quick Start Geo Clustering for SUSE Linux Enterprise High Availability Extension》(Geo Clustering for SUSE Linux Enterprise High Availability Extension 快速入門)。
Hawk 記錄檔案位於 /srv/www/hawk/log 中。如果您無法存取 Hawk,請查看這些檔案。
如果您在使用 Hawk 啟動或停止資源時遇到問題,請查看 Pacemaker 記錄訊息。Pacemaker 記錄訊息的位置在 /etc/corosync/corosync.conf 的 logging 區段中指定。
如果您無法以屬於群組 haclient 的新使用者身分登入 Hawk (或者在 Hawk 接受您以此使用者身分登入前發生延遲),請停止 nscd 精靈:
systemctl stop nscd.service請再試一次。
若要在首次啟動 Hawk 時避免出現關於自行簽署的證書的警告,請以您自己的證書或官方證書管理中心 (CA) 簽署的證書取代自動建立的證書。
該證書儲存在 /etc/lighttpd/certs/hawk-combined.pem 中,其中包含金鑰和證書。
變更許可權以使檔案只可由 root 存取:
chown root.root /etc/lighttpd/certs/hawk-combined.pem
chmod 600 /etc/lighttpd/certs/hawk-combined.pem在建立或收到新的金鑰和證書之後,執行以下指令將它們進行組合:
cat keyfile certificatefile > /etc/lighttpd/certs/hawk-combined.pem
根據您在或 中定義的時段,以及在此期間叢集中發生的事件,Hawk 可能會收集大量資訊。這些資訊儲存在 /tmp 目錄下的記錄檔案中。這可能會用盡節點上剩餘的可用磁碟空間。如果使用或後 Hawk 無回應,請檢查叢集節點的硬碟,並移除相應的記錄檔案。
如果將叢集新增至 Hawk 的儀表板時失敗,請檢查過程 5.31, “使用 Hawk 監控多個叢集” 中列出的必要條件。
僅輪詢每個叢集中的一個節點的狀態。如果輪詢的節點已關閉,儀表板將會按順序輪詢另一個節點。在這種情況下,Hawk 會顯示一則簡短的警告訊息,說明該節點無法存取。在 Hawk 找到另一個可存取的節點後,該訊息便會消失。