インフォキューブには、次元に属しているメンバーの値を任意の組み合わせで格納出来ます。例えば、3次元のインフォキューブには、(月、製品、顧客)の任意のトリプレットに対応するセルを設定出来ます。インフォキューブの実際のサイズは、設定されているセルの最大数です。例えば、24か月、500種類の製品、1000人の顧客で考えると、月-製品-顧客のインフォキューブでは、実際のサイズは24x500x1000=12,000,000セルになります。一般に、データをインフォキューブにロードした後で、データを実際に格納しているのは、インフォキューブのセル全体のごく一部にすぎません。データを格納しているセルの実数とインフォキューブのセルの合計数(各次元のメンバー数を乗算)の割合が、インフォキューブの濃度です。
BOARDは、インフォキューブの次元のあらゆる可能値に対してセルを作成するわけではありません。圧縮方式には、様々な種類があります。その中でも最も重要な方式は、スパース管理です。
例えば、小規模な小売店、レストラン、ホテル、ケータリング業者、病院、学校を販売先とする、製品数も顧客数も多い、食品飲料会社のような企業について考えてみます。このような企業の平均的な顧客は、製品全体から見れば、ごくわずかな種類の製品を購入していると考えられます。病院が購入する製品は、ホテルや学校が購入する製品とは種類が異なると考えられます。ある特定の顧客があらゆる種類の製品を購入するわけではなく、ある特定の製品があらゆる顧客向けに提供されているわけでもありません。このような状況に当てはまる場合に、顧客と製品はスパースであると定義します。顧客C1が製品P1を購入した場合、(C1-P1)はスパース組み合わせと呼ばれます。
スパース構造は、(階層的に関連のない)2つ以上のエンティティの組み合わせです。スパース構造に該当する値の組み合わせの数は、有効な組み合わせの合計数と比較すると、少なくなります。スパース組み合わせは、データがインフォキューブにロードされた時点で作成されます。スパース構造が定義されたときに、ロード時に作成されたスパース組み合わせに限定してディスクスペースが割り当てられます。従って、ディスクスペースのオーバヘッドは最小限に抑えられます。
スパース構造は、インフォキューブのバージョンを作成したときに定義されます。
時間エンティティをスパース構造に含めることは出来ません。ある程度のディスクスペースの圧縮は、スパース構造に含まれていない次元でも発生することに注意してください。
2つ以上の次元を含むインフォキューブを作成するときには、以下のガイドラインに従ってスパース構造を定義します。