o k«ÏiýMã#@s,UdZddlZddlmZddlmZmZddlmZddl Z ddl mZedƒZedƒZ iZee jjefed <ehd £ƒZdeded eee fdeeee fgeee fffdd„Z dCddddœde jde jde jdee jdededede jfdd„Zeddeƒ dCddddœde jde jde jdee jdededede jfdd„ƒZd eed!edefd"d#„Zd$e jd%edede jfd&d'„Zd(e jd)e jd*ed+ed eed,ede jfd-d.„Zd*ed+eddfd/d0„Z d(e jd)e jd*ed+ed eede jfd1d2„Z! dDdddddd3dd4œd(e jd)e jd5e jd6ee jd7ee jd8ee jd9ed:ed;ed,ed eedd?„Z#ed@de#ƒ dDdddddd3dd4œd(e jd)e jd5e jd6ee jd7ee jd8ee jd9ed:ed;ed,ed eedéé ééÚop_typeÚ opset_versionÚ fake_implÚreturncs.dtttfdtttff‡‡‡fdd„}|S)zDDecorator to register an ONNX operator with a custom implementation.ÚfuncrcsPdˆ›}tjjdˆ›d|›dd|ƒ}|ttttjjˆƒ|ƒ<| ˆ¡|S)NÚopsetzonnx::Ú.©)Úmutates_args)ÚtorchÚlibraryÚ custom_opr ÚgetattrÚopsÚonnxÚ register_fake)rÚoverloadÚtorch_op©rrrrú^/var/www/addictedbytheproject.nl/epg/venv/lib/python3.10/site-packages/torch/onnx/ops/_impl.pyÚ decorator's ÿþÿ z_onnx_op..decorator)rrr)rrrr"rr r!Ú_onnx_op"s*r#F)ÚinterleavedÚ num_headsÚrotary_embedding_dimÚxÚ cos_cacheÚ sin_cacheÚposition_idsr$r%r&cCs| ¡S)zFFake implementation for RotaryEmbedding-23 for torch.compile purposes.)Úclone)r'r(r)r*r$r%r&rrr!Ú_rotary_embedding_23_fake_impl5sr,ÚRotaryEmbeddingécs|j‰tˆƒ}ˆd‰ˆd‰ˆdurWt ˆ ¡dk‡fdd„¡t ˆjdˆk‡‡fdd„¡t ˆjdˆk‡‡fd d„¡t ˆ ¡dkoNˆ ¡dk‡‡fd d„¡nt ˆ ¡dkodˆ ¡dk‡‡fdd„¡|d krwt |d¡}n$|dkr›t |dk‡fdd„¡ˆd}||} ˆˆ|| g} t || ¡}t t|jƒd kdd„¡|jd} |dkr³| }|dd…dd…dd…d|…f}|dd…dd…dd…|d…f}|d‰ˆduräˆˆ‰ˆˆ‰nˆ‰ˆ‰t ˆjdˆko÷ˆjdˆk‡‡‡fdd„¡t ˆjdˆkoˆjdˆk‡‡‡fdd„¡t ˆjdˆk‡‡fdd„¡t ˆjdˆk‡‡fdd„¡t ˆd¡‰t ˆd¡‰|rk|dd…dd…dd…ddd…f} |dd…dd…dd…ddd…f}n tj|ddd\} }ˆ| ˆ|}ˆ| ˆ|}|r¥t |d¡}t |d¡}tj ||fdd}t ||j¡}n tj ||fdd}tj ||fdd}|dkrÂt |ˆ¡St |d¡S)z_RotaryEmbedding-23 https://onnx.ai/onnx/operators/onnx__RotaryEmbedding.html#rotaryembedding-23réþÿÿÿNécsdˆj›S)Nz6position_ids must be 2D when provided. Received shape ©Úshaper)r*rr!ÚZsz%rotary_embedding_23..csdˆ›dˆjd›S)Nz6position_ids first dim (batch) must match x.shape[0] (ú). Received rr1r)Ú batch_sizer*rr!r3^ór csdˆ›dˆjd›S)Nz;position_ids second dim (sequence) must match x.shape[-2] (r4r r1r)r*Úsequence_lengthrr!r3br6códˆj›dˆj›S)NzWcos_cache/sin_cache must be 2D when position_ids is provided. Received cos_cache shape ú, sin_cache shape r1r©r(r)rr!r3fó ÿÿécr8)Nz[cos_cache/sin_cache must be 3D when position_ids is not provided. Received cos_cache shape r9r1rr:rr!r3lr;é)rr0r r<cs dˆ›S)NzKnum_heads must be provided for 3D inputs. Received input tensor with shape rr)Úinput_shaperr!r3ys cSódS)Nzx should be a 4D tensor by nowrrrrr!r3€ócsdˆj›dˆ›dˆ›dS)Nzcos has shape ú but expected (batch=ú, seq=ú, ...)r1r)r5Úcosr7rr!r3™ócsdˆj›dˆ›dˆ›dS)Nzsin has shape rArBrCr1r)r5r7Úsinrr!r3rEéÿÿÿÿcsdˆjd›dˆ›dS)NzLast dimension of cos cache (rGú') should match rotary_embedding_dim/2 (ú).r1r)rDÚrotary_embedding_dim_halfrr!r3¡ócsdˆjd›dˆ›dS)NzLast dimension of sin cache (rGrHrIr1r)rJrFrr!r3¥rK©Údim) r2ÚlenrÚ_checkrMÚpermuteÚreshapeÚ unsqueezeÚchunkÚcat)r'r(r)r*r$r%r&Ú input_rankÚhidden_sizeÚ head_sizeÚ new_shapeÚx_rotateÚx_not_rotateÚx1Úx2ÚrealÚimagÚx_rotate_concatÚoutputr) r5rDr(r>r*rJr7rFr)r!Úrotary_embedding_23Cs´ þþþþþ þ ÿÿþþþþÿÿ"$ raÚscalerWcCs|dur|Sdt |¡S)z/Get the scale factor for attention computation.Ngð?)ÚmathÚsqrt)rbrWrrr!Ú_get_scale_factorËsreÚtensorr5cCs:|jd|jd}}||}| ||||¡ dd¡ ¡S)z1Reshape 3D tensor to 4D for multi-head attention.r r0)r2ÚviewÚ transposeÚ contiguous)rfr5r%r7rVrWrrr!Ú_reshape_3d_to_4dÐsýrjÚQÚKÚcurrent_q_num_headsÚcurrent_kv_num_headsÚqk_matmul_output_modec Cs2|dkrt|||||ƒSt t || dd¡¡¡S)z1Get QK output tensor based on the specified mode.rr/rG)Ú_compute_qk_output_for_mode_0rÚ zeros_likeÚmatmulrh)rkrlrmrnrbrorrr!Ú_get_qk_output_for_aten_spdaÝs ÿrscs"t ˆˆdk‡‡fdd„¡dS)z-Validate Group Query Attention configuration.rcsdˆ›dˆ›dS)Nz q_num_heads (z%) must be divisible by kv_num_heads (z ) for GQArr©rnrmrr!r3õsz-_validate_gqa_configuration..N)rrO)rmrnrrtr!Ú_validate_gqa_configurationïs þrucCs`|}||kr||}|j|dd}t||jdƒ}t |¡}||} ||} t | | dd¡¡S)zDHelper function to compute QK output for qk_matmul_output_mode == 0.r rLr<r/rG)Úrepeat_interleaverer2rcrdrrrrh)rkrlrmrnrbÚK_for_qkÚ repeat_factorÚscale_factorÚ sqrt_scaleÚQ_scaledÚK_scaledrrr!rpùs rpç)Ú is_causalÚkv_num_headsÚq_num_headsrorbÚsoftcapÚsoftmax_precisionÚVÚ attn_maskÚpast_keyÚ past_valuer~rr€rr‚cCsZ|jd} t|jƒdkrE|jd}|j}|dur,| ||jd|jd|jd|f}n| ||jd|jd|f}|}| |||df}n:|jd}|j}|duri|jd|jd|jd|jd|jdf}n|j}|}|jd|jd|jd|df}tj||j|jd}tj||j|jd}tj||j|jd}tj||j|jd}||||fS)z@Fake implementation for Attention-23 for torch.compile purposes.rr<r Nr0©ÚdtypeÚdevice)r2rNrÚemptyrˆr‰)rkrlrƒr„r…r†r~rr€rorbrr‚r5Úq_sequence_lengthÚoutput_shapeÚpresent_key_shapeÚpresent_value_shapeÚqk_output_shaper`Úpresent_keyÚ present_valueÚ qk_outputrrr!Ú_attention_23_fake_implsR üüü üür“Ú Attentionc'Cs–d\} }}t|jƒ}|jd}t|jƒdkr;t |dko|dkdd„¡|jd}t|||ƒ}t|||ƒ}t|||ƒ}t t|jƒdkoQt|jƒdkoQt|jƒdkdd„¡|j|}t| |ƒ} |d urmtj||g|d n| ¡}|d ur~tj||g|d n| ¡}||}}|j| }|j| }|j|}|j|}|dko°| dko°|d uo°|d up°|jtj k}t ||ƒ|rÕtjjj ||||d|| t ||kƒd}t||||| | ƒ}nÞ||krë||}|j|| d }|j|| d }tj|||j|jd }|rt |d udd„¡t tj||tj |jd ¡}| |tdƒ¡}|d ur4|jtj kr0| |tdƒ¡}n||}t| |jdƒ}t |¡} || }!|| }"t |!|" dd¡¡}#|#}|#|}$| dkr`|$}|dkrn|t |$|¡}$| dkru|$}|d urŸ|tvr—|$j}%|$ tj|¡}$tj|$dd }&|& |%¡}&ntj|$dd }&ntj|$dd }&| dkr|&}t |&|¡}|dkrÅ| dd¡ ¡ !||d¡}||||fS)zMAttention-23 https://onnx.ai/onnx/operators/onnx__Attention.html#attention-23)r r0r<rr<cSr?)Nz;q_num_heads and kv_num_heads must be provided for 3D inputsrrrrr!r3€r@zattention_23..r r=cSr?)Nz'Q, K, and V should be 4D tensors by nowrrrrr!r3‰r@NrLr})r„Ú dropout_pr~rbÚ enable_gqar‡cSr?)Nz'Cannot use both is_causal and attn_maskrrrrr!r3×r@z-infr/rGr0)"rNr2rrOrjrerTr+rˆÚboolruÚnnÚ functionalÚscaled_dot_product_attentionrsrvÚzerosr‰ÚtrilÚonesÚmasked_fillÚfloatrcrdrrrhÚtanhÚ-_ATTENTION_23_ALLOWED_INTERMEDIATE_PRECISIONSÚtorÚONNX_DTYPE_TO_TORCH_DTYPEÚsoftmaxrirg)'rkrlrƒr„r…r†r~rr€rorbrr‚Únum_head_dimÚsequence_dimÚhead_dimÚinput_shape_lenr5r‹Úq_head_sizerr‘rmrnÚkv_sequence_lengthÚcan_use_sdpar`r’rxÚ attn_biasÚcausal_maskryrzr{r|Úqk_matmul_outputÚqk_with_biasÚoriginal_dtypeÚ qk_softmaxrrr!Úattention_23csä þ (þ ÿýÿý ÿþü ÿø úÿÿüÿ ÿ ÿr²)N)NNN)%Ú__doc__rcÚcollections.abcrÚtypingrrÚtyping_extensionsrrÚtorch.onnx.opsrrrr ÚdictÚ_opsÚ OpOverloadÚ__annotations__Ú frozensetr¡ÚstrÚintr#ÚTensorr—r,rarŸrerjrsrurpÚtupler“r²rrrr!Ús„ÿ ÿÿ ÿ þüøÿþýüúùø ÷ üøÿþýüúùø ÷ÿÿÿ þ ÿþýüûú ùÿÿ þ ÿþýüû úúòÿþýüûúø ÷ öõô óò ñ Túòÿþýüûúø ÷ öõô óòñ