0%

簡要說明 :

此篇論文發表於2016年,摘要中簡要提出當前人臉偵測與矯正所遇到的困境,例如 : 複雜環境、人臉姿態、光照、遮擋(occlusions)。作者提出一個利用固有的相關關係來提升效能的深度學習框架(Deep Cascaded Multi-task framework),此框架採用一個三階段CNN的聯集架構用於預測人臉與五官在圖像中的位置,並且是一個從粗到細的方法。除此之外,作者還提出一項新的online hard sample mining策略,可以在不需手動採養選取的情況下自動提高效能。

補充與理解 :

針對人臉偵測的應用場景來說,我個人認為作者主要把重心放在場景相對複雜的實時動態人臉偵測。我目前的研究項目與應用場景(門禁系統)中其實是相對簡單,傳統人臉檢測方式(Haar, LBP, dlib)在CPU等級是可以符合大多數的應用,但由於我是用於一般家庭的門禁系統,因此對於在檢測方面魯棒性要求要高,才能滿足用戶體驗,傳統方法嚴重受限於場景。

從摘要中可以得知,作者提出幾個要點 :

  1. 利用人臉特徵與人臉關鍵點的關聯訊息得到效能與準確度提升。
  2. 採用三階段輕量的網路聯集架構,每個階段是從粗到細的過程。
  3. 提出新的online hard sample mining。
Read more »

概說:

此篇論文提出一個從成本/金錢層面對儲存系統進行評估的方案,評估對象包含性能等方面。

貨幣成本應該在儲存系統的預期壽命內進行評估,並考慮設備的磨損(wear-out)和更換。

相關領域研究中,很少有人探討Tiering和Caching在混合儲存系統中的利弊。本文為促進研究,開發了一套冊被映射(device-mapper)目標程式給Linux Kernel,目的是結合SSD和HDD。此套App想在SSD上起到2個作用:

  1. 將SSD作為Cache,並把髒資料(dirty data)異步回寫到HDD中
  2. 將SSD作為主要儲存設備(Tier)
  3. 其他: 其餘目標還有管理冷熱資料在SSD和HDD之間的通用策略

在儲存系統的案例中,作者觀察業界真實使用情況與自身經驗,總結了以下情況:

  1. 發現在某些工作負載/使用情況(workload),純SSD的方案會在短期內帶來高成本,但長期使用下成本會低得多。
  2. 還有一些情況,用SSD作為Cache比在Tier上作為熱資料的主要儲存設備的成本要低得多。但剩餘的工作負載皆與之相反。
Read more »

Here is the paper.

市場上雖然有許多基於SSD的multi-tier的storage解決方案,但如何配置最佳的設備給每個tier,來達到用最小的花費完成最好的performance。

本文提出的方法叫 “Extent-based Dynamic Tiering (EDT) Solution”。首先什麼是extent? 一個extent指的是一段連續的儲存空間,而一個檔案的物理大小一定是一個extent容量的整數倍;其次,EDT又是用哪些方法來完成上述的目標? 總共有兩個關鍵元件作為基礎,以下是簡述:

  1. A Configuration Adviser (EDT-CA): 決定購買和安裝合適的混合storage device來滿足一個給定工作負載/應用場景的最低成本。
  2. A Dynamic Tier Manager (EDT-DTM): 在當前給定的工作負載/應用場景中,EDT-DTM運行在configured storage system,通過動態地搬移extent (fixed-size portions of a volume)來將資料放置在最合適的tier上。
Read more »

The project is an algorithm reproduction of the paper “Automating Distributed Tiered Storage Management in Cluster Computing“. In brief, the main idea concept of the prediction is HOW TO GENERATE THE USEFUL DATA OR FEATURE TO THE MODEL. The paper emphasis on how to collect the data, preprocessing, and determine which attribution is useful, then extract them to the features. The model it use is XGBoost, and it says directly. There only 2 hyper parameters matter: one is “the depth” of the tree, the other is “the rounds” of the training.

Read more »