डेटा मॉडल
StableHLO प्रोग्राम, टेंसर की मदद से कंप्यूटेशन करते हैं
(एन-डाइमेंशन सरणियों), जो मौजूदा मॉडल में, इसका इस्तेमाल करके लागू किए जाते हैं
क्लास Tensor
. Tensor
ऑब्जेक्ट के लिए स्टोरेज क्लास,
detail::Buffer
, टेंसर के mlir::ShapedType
को
mlir::HeapAsmResourceBlob
ऑब्जेक्ट, टेंसर के बदले जा सकने वाले ब्लॉब को दिखा रहा है
डेटा को निरंतर बाइट अरे के रूप में रखा गया है
माइनर-टू-माइनर ऑर्डर.
मेमोरी मैनेजमेंट को आसान बनाने के लिए, detail::Buffer
ऑब्जेक्ट को रेफ़रंस के तौर पर गिना जाता है.
टेंसर के अलग-अलग एलिमेंट को Element
क्लास का इस्तेमाल करके दिखाया जाता है, जो
ऐसे भेदभाव वाले यूनियन का इस्तेमाल करता है जो APInt
, APFloat
या
स्टोरेज के लिए pair<APFloat,APFloat>
. आखिरी वाले का इस्तेमाल एलिमेंट सेव करने के लिए किया जाता है
और जटिल टाइप की मदद से उसे समझा जा सकता है.
Tensor
में अपने एलिमेंट से इंटरैक्ट करने के लिए, ये एपीआई उपलब्ध हैं:
Element Tensor::get(llvm::ArrayRef<int64_t> index)
: एक्सट्रैक्ट करने के लिए मल्टी-डाइमेंशन इंडेक्सindex
मेंElement
के तौर पर व्यक्तिगत टेंसर एलिमेंट ऑब्जेक्ट है.void Tensor::set(llvm::ArrayRef<int64_t> index, Element element);
: कई डाइमेंशन में,Element
ऑब्जेक्टelement
को टेंसर में अपडेट करने के लिए इंडेक्सindex
.
अनुवादक के काम करने का तरीका
इंटरप्रेटर के लिए एंट्री फ़ंक्शन यह है
SmallVector<Tensor> eval(func::FuncOp func, ArrayRef<Tensor> args);
जो नीचे दी गई चीज़ें करता है:
func
के SSA आर्ग्युमेंट और उनसे जुड़े रनटाइमTensor
को ट्रैक करता है वैल्यू, जो सिंबल टेबल मैप, M का इस्तेमाल करकेargs
में दी गई हैं.func
में हर सेशन के लिए, SSACFG के क्रम में:- ऑप पर
eval
को शुरू करता है. op के हर SSA ऑपरेंड के लिए, इसकीeval
को शुरू करने के लिए तर्क के तौर पर M से रनटाइम वैल्यू दी जाएगी. - ऑप के SSA नतीजे और M में इवैलुएशन की गई वैल्यू को ट्रैक करता है.
- ऑप पर
(2) में बताया गया सेशन-लेवल eval
,
सेशन के सिमेंटिक्स यहां stablehlo::AddOp
का एक उदाहरण दिया गया है.
उदाहरण में, lhs
और rhs
टेंसर के अलग-अलग एलिमेंट पेयर के हिसाब से हैं
Element
ऑब्जेक्ट के तौर पर निकाला गया, जिसे बाद में जोड़ा गया. जोड़ने का नतीजा,
Element
ऑब्जेक्ट, result
के आखिरी टेंसर में सेव है.
Tensor eval(AddOp op, const Tensor &lhs, const Tensor &rhs) {
Tensor result(op.getType());
for (auto it = result.index_begin(); it != result.index_end(); ++it)
result.set(*it, lhs.get(*it) + rhs.get(*it));
return result;
}
कुल मिलाकर, अनुवादक के डिज़ाइन को इस तरह से ऑप्टिमाइज़ किया गया है कि वह आसानी से पढ़े जा सके
अलग-अलग ऑपरेशन के लिए eval
फ़ंक्शन को लागू करना, क्योंकि इसका मकसद
StableHLO के लिए रेफ़रंस इंप्लिमेंटेशन का काम करते हैं. उदाहरण के लिए,
eval
को टेंप्लेट फ़ंक्शन के तौर पर तय करना और उसे एलिमेंट टाइप की मदद से पैरामीटर करना,
हम इस बारे में जानकारी देते हैं कि अलग-अलग तरह के एलिमेंट को कैसे हैंडल किया जाता है
Element::operator+
वगैरह. इससे eval
को आसानी से लागू किया जा सकता है.
कॉन्स्टेंट फ़ोल्डिंग के लिए अनुवादक का इस्तेमाल करना
हम कॉन्सटैंट ऑपरेंड के साथ कार्रवाइयों को फ़ोल्ड करने के लिए, अनुवादक तकनीक का इस्तेमाल कर सकते हैं
वैल्यू. नीचे दिया गया कोड स्निपेट, इसे लागू करने का तरीका दिखाता है
फ़्लोटिंग-पॉइंट टाइप किए गए ऑपरेंड के साथ stablehlo::AddOp
को फ़ोल्ड करने के लिए:
OpFoldResult AddOp::fold(FoldAdaptor adaptor) {
auto attrs = adaptor.getOperands();
DenseElementsAttr lhsData = dyn_cast<DenseElementsAttr>(attrs[0]);
DenseElementsAttr rhsData = dyn_cast<DenseElementsAttr>(attrs[1]);
if (!lhsData || !rhsData) return {};
auto lhs = Tensor(lhsData);
auto rhs = Tensor(rhsData);
auto result = eval(*this, lhs, rhs);
SmallVector<APFloat> values;
for (auto i = 0; i < result.getNumElements(); ++i) {
Element element = result.get(i);
values.push_back(cast<FloatAttr>(element.getValue()).getValue());
}
return DenseElementsAttr::get(result.getType(), values);
}
फ़िलहाल, हम इस पर काम नहीं कर रहे हैं कि अनुवादक को
लगातार फ़ोल्ड करना इसलिए ज़रूरी है, क्योंकि हम StableHLO के लिए फ़ोल्डर लागू करने के बारे में नहीं सोच रहे हैं.
हालांकि, आने वाले समय में हमारी कोशिश है कि आने वाले समय में इंटरप्रेटर की मदद से
MHLO में फ़ोल्ड करना, तब हम कोड स्निपेट के एर्गोनॉमिक्स को बेहतर बनाएंगे
ऊपर दिया गया है (उदाहरण के लिए, हम एक ऐसा हेल्पर फ़ंक्शन रख सकते हैं जो स्थायी ऑपरेंड को पैक करता है
Tensor
ऑब्जेक्ट और Tensor
के नतीजों को OpFoldResult
में अनपैक करता है).
StableHLO इंटरप्रेटर की जांच करना
अनुवादक, इनपुट के तौर पर (A) StableHLO प्रोग्राम और (B) डेटा वैल्यू को
उसे प्रोग्राम में फ़ीड किया जाता है और आउटपुट डेटा की ऐसी वैल्यू जनरेट करता है जो
उपयोगकर्ता से मिले अनुमानित डेटा वैल्यू से अलग रखना चाहिए. डेटा की वैल्यू (B) हैं
stablehlo.constant
संक्रियाओं का इस्तेमाल करके प्रोग्राम में हार्ड कोड किया गया. कॉन्टेंट बनाने
अनुवादक, इनपुट प्रोग्राम का आकलन करता है. टेस्ट किए जा रहे सेशन के आउटपुट
को चेक से चेक किया जाता है (जैसे कि check.expect_eq
, check.expect_almost_eq
), तो
नीचे दी गई जानकारी देखें. check.expect_eq
और check.expect_eq_const
बिट के हिसाब से देखें
किसी भी तरह के काम करने वाले टाइप के लिए बराबर और check.expect_almost_eq
और
check.expect_almost_eq_const
सहिष्णुता के दायरे में आने वाली बराबरी की जांच करता है,
फ़्लोटिंग पॉइंट और कॉम्प्लेक्स टाइप के लिए, टेस्टिंग दिशा-निर्देश (G6) में बताया गया है.
// CHECK-LABEL: Evaluated results of function: add_op_test_ui4
func.func @add_op_test_ui4() {
%0 = stablehlo.constant dense<[0, 2]> : tensor<2xui4>
%1 = stablehlo.constant dense<[15, 3]> : tensor<2xui4>
%2 = stablehlo.add %0, %1 : tensor<2xui4>
check.expect_eq_const %2, [15, 5] : tensor<2xui4>
func.return
}
stablehlo-translate --interpret
टेस्ट यूटिलिटी
(कोड)
प्रोग्राम को पार्स करने की ज़िम्मेदारी है. इसमें हर फ़ंक्शन को समझाना, जैसे कि
इसमें फ़ंक्शन शामिल होता है. हमारे पास एक खास टेस्ट-सुइट है.
जिसमें हर StableHLO ऑपरेटर के लिए, रनटाइम की अलग-अलग गतिविधियों की जांच की जाती है.
जांच यहां देखी जा सकती हैं.
जांच के दिशा-निर्देश
(G1) क्या हमें हर सेशन के लिए काम करने वाले सभी टाइप की जांच करनी होगी?
तय करने के लिए, हम नीचे दिए गए नियमों के कॉम्बिनेशन का इस्तेमाल कर सकते हैं:
सेशन लागू करते समय, अगर उससे जुड़े
eval
में कोड मौजूद हो फ़ंक्शन है, तो एक या उससे ज़्यादा टेस्ट होने चाहिए करना है. उदाहरण के लिए,add
सेशन के लिए एक खास कोड है का इस्तेमाल पूर्णांक, बूलियन, फ़्लोटिंग-पॉइंट, और कॉम्प्लेक्स टाइप को हैंडल करने के लिए किया जाता है. इस वजह से, हम हर कैटगरी के लिए अलग-अलग टेस्ट कराना ज़रूरी है.अगर टाइप के किसी सेट को, उससे जुड़े
eval
फ़ंक्शन में एक जैसा हैंडल किया जाता है, तो उन सभी प्रकारों के लिए एक ही टेस्ट काफ़ी होना चाहिए. उदाहरण के लिए,add
सेशन के लिए, पूर्णांक टाइप के सभी वैरिएंट (si4
,u4
,si8
,u8
इन्हेंllvm::APInt
एपीआई का इस्तेमाल करके एक जैसा मैनेज किया जाता है. इसलिए, हम इन्हें स्किप कर सकते हैं उनमें से हर वैरिएंट के लिए टेस्ट जोड़ना होगा. साथ ही, एक बार में एक ही वैरिएंट जोड़ना होगा प्रतिनिधि टेस्ट. प्रतिनिधि को चुनने में अस्पष्टता से बचने के लिए, हम को नीचे दिए गए दिशा-निर्देशों का इस्तेमाल करना चाहिए:- अगर सभी टाइप एक ही तरह से हैंडल किए जाते हैं, तो प्रिमिटिव टाइप एक ही होता है (यानी, अगर सभी पूर्णांक, फ़्लोटिंग-पॉइंट या कॉम्प्लेक्स टाइप हैं), तो ज़्यादा से ज़्यादा बिट-विथ वाला विकल्प चुनें.
- अगर सभी टाइप को एक ही तरीके से हैंडल किया जाता है, तो प्रिमिटिव टाइप का मिला-जुला रूप है, फिर नीचे दिए प्रिमिटिव टाइप वाला कोई एक चुनें. प्राथमिकता: पूर्णांक, फ़्लोटिंग-पॉइंट, बूलियन, कॉम्प्लेक्स.
(G2) हम यह कैसे तय करते हैं कि किसी सेशन में छात्र/छात्राओं से जुड़ी क्या है?
इसका मकसद, सेशन के लिए अनुवाद करने वाले व्यक्ति के तर्क को अच्छी तरह से कवर करना है (यानी लागू करने के सभी कोने वाले केस) बेहद कम जांच के साथ. रखरखाव के लिए, टेस्ट की संख्या को कम करना ज़रूरी है. कम परीक्षण तो उनकी समीक्षा करना और यह सुनिश्चित करना बहुत आसान है कि सेशन को अच्छी तरह से कवर करें. इसके नतीजे के तौर पर, हम उम्मीद करते हैं कि ऑपरेशन के आखिर में बस एक ही टेस्ट होगा. अगर किसी वजह से, पूरी जानकारी मिलेगी कवरेज अव्यावहारिक है, इसलिए >= 90% पर ही रुकना सही है. यह फ़ैसला लिया जाएगा पुल अनुरोध की समीक्षा के दौरान, अलग-अलग मामलों के हिसाब से तय होगा.
(G3) इंटरप्रेटर इन्फ़्रास्ट्रक्चर के लिए टेस्ट जोड़ने के बारे में क्या ख्याल है?
अनुवादक इन्फ़्रास्ट्रक्चर ज़्यादातर आसान है और इसे
हमारा भरोसा बेस है. एक छोटा सा हिस्सा यह है कि अलग-अलग तरह के
इसे पहले से मौजूद अनुवादक स्टोरेज में से पैक नहीं किया जा सकता. जैसा कि (G1) में बताया गया है, हमने
सिर्फ़ उन सेशन की जांच की जाएगी जिन्हें अलग तरह से मैनेज किया जाता है. के साथ
हो सकता है कि पैकिंग/अन-पैकिंग कोड,
पूर्णांक/फ़्लोटिंग-पॉइंट टाइप के वैरिएंट हो सकते हैं. ऐसा हो सकता है कि ये वैरिएंट,
टेस्टिंग हो रही है. पूरा कवरेज पाने के लिए, हम constant
जैसा कोई सेशन चुन सकते हैं, जो
यह सभी तरह के StableHLO एलिमेंट के साथ काम करता है. साथ ही, पूरी जानकारी वाले टेस्ट भी लिखता है.
(G4) अगर किसी ऑप को लागू करना अन्य ऑपरेशन पर निर्भर करता है, तो क्या हमें को कैसे टेस्ट करें?
नहीं. उदाहरण के लिए, batch_norm_grad
को लागू करने का तरीका इन बातों पर आधारित हो सकता है
divide
, subtract
, multiply
, और अन्य. हमें बाद वाले टूल की जांच करने से बचना चाहिए
ऑपरेशन की जानकारी मिलेगी.
(G5) क्या हमें, लागू करने के बारे में तय किया गया / तय नहीं किया गया विकल्प लागू करने के लिए टेस्ट लिखना चाहिए व्यवहार?
हमें ऐसे टेस्ट नहीं लिखना चाहिए जो लागू करने के तरीके या सेशन में बताए गए व्यवहार नहीं बताए गए हैं. लागू करने के आधार पर तय किए गए बिहेवियर की जांच करता है अनुवादक के स्थानीय व्यवहार को दिखाएँ, जिसे नहीं सामान्य. तय नहीं किए गए व्यवहार को मापने वाले टेस्ट से, ऐसे व्यवहार पर कोई असर नहीं पड़ता ऑप के व्यवहार को समझ सकते हैं.
(G6) फ़्लोटिंग-पॉइंट टाइप के लिए टेस्ट लिखते समय, क्या जांच में नतीजे के तौर पर सभी को शामिल करना ज़रूरी है?
प्राथमिक संक्रियाओं (जोड़, घटाव, गुणा, भाग, और
वर्ग), आईईईई स्पेसिफ़िकेशन के मुताबिक लागू करने पर
गणित के हिसाब से सटीक नतीजे के 0.5 ULP तक राउंड ऑफ़ नतीजे. इसके साथ ही, हम
इन कार्रवाइयों से मिलने वाले संभावित नतीजों की कल्पना
1 यूएलपी के अंतर से. हालांकि, ऐसा हो सकता है कि यह ट्रांसेंडेंटल फ़ंक्शन के लिए काम न करे
(sine
, cosine
वगैरह) जिनके लिए सटीक होने की गारंटी होती है
लागू करने के बारे में जानकारी (वजह).
मौजूदा लागू करने के तरीके में "वन-साइज़-सभी-के लिए" का इस्तेमाल किया गया है. 0.0001 सहिष्णुता मान. नीचे दिया गया उदाहरण, ऊपर बताई गई सहनशीलता को दिखाता है.
func.func @check_tolerance() {
%0 = stablehlo.constant dense<0.2> : tensor<f32>
// The following check succeeds as %0 is almost equal to the provided
// constant modulo the tolerance, mentioned above.
check.expect_almost_eq_const %0, dense<0.19999> : tensor<f32>
// The following check fails as %0 is not bitwise equal to the provided
// constant.
check.expect_eq_const %0, dense<0.19999> : tensor<f32>
func.return
}
यह StableHLO ऑपरेशन की अंकों में सटीक जानकारी की जाँच करने का सिर्फ़ पहला कदम है. फ़िलहाल, StableHLO की खास बातों में यह शामिल नहीं है. साथ ही, इस समस्या को हल करने के लिए, #1156 पर काम चल रहा है यह रेटिंग, StableHLO के इस्तेमाल और इनके सुझाव, राय या शिकायत के आधार पर दी गई है स्टेकहोल्डर. जैसे-जैसे यह प्रक्रिया आगे बढ़ेगी, हम अपने इन्फ़्रास्ट्रक्चर को अपडेट करेंगे उसी के हिसाब से.
(G7) टेस्ट की कोडिंग स्टाइल के बारे में कुछ और बताना है?
- पक्का करें कि डिफ़ॉल्ट वैल्यू के बजाय, इनपुट/आउटपुट के असल नाम का इस्तेमाल किया गया हो एसएसए वैल्यू का इस्तेमाल करता है (जैसे कि %0, %1 वगैरह)
- अगर प्रिटी-प्रिंटेड फ़ॉर्मैट मौजूद है, तो पक्का करें कि टेस्ट में उसका इस्तेमाल किया गया हो.
(G8) क्या हमें स्पेसिफ़िकेशन में पहले से दिए गए उदाहरण को शामिल करना चाहिए? हां (जांच पूरी होने के लिए).